TL;RD: sí, se puede hacer sin saber los nombres de las claves de antemano, y ninguno de los formatos de datos alternativos tiene ninguna ventaja sobre el original.
Esto se puede hacer sin conocer los nombres de las claves de antemano, pero es doloroso... básicamente, debe mirar cada valor en la tabla para determinar el conjunto de claves distintas en la tabla antes de poder sumarlas. Debido a este requisito, y al hecho de que todos los formatos de datos alternativos pueden tener varias claves por entrada, no hay ninguna ventaja en utilizar ninguno de ellos.
Como tienes que buscar todas las claves distintas, es igual de fácil hacer las sumas mientras las buscas. Esta función y procedimiento juntos harán eso. La función, json_merge_sum
, toma dos valores JSON y los fusiona, sumando los valores donde aparece una clave en ambos valores, por ejemplo,
SELECT json_sum_merge('{"key1": 1, "key2": 3}', '{"key3": 1, "key2": 2}')
Salida:
{"key1": 1, "key2": 5, "key3": 1}
El código de función:
DELIMITER //
DROP FUNCTION IF EXISTS json_merge_sum //
CREATE FUNCTION json_sum_merge(IN j1 JSON, IN total JSON) RETURNS JSON
BEGIN
DECLARE knum INT DEFAULT 0;
DECLARE jkeys JSON DEFAULT JSON_KEYS(j1);
DECLARE kpath VARCHAR(20);
DECLARE v INT;
DECLARE l INT DEFAULT JSON_LENGTH(jkeys);
kloop: LOOP
IF knum >= l THEN
LEAVE kloop;
END IF;
SET kpath = CONCAT('$.', JSON_EXTRACT(jkeys, CONCAT('$[', knum, ']')));
SET v = JSON_EXTRACT(j1, kpath);
IF JSON_CONTAINS_PATH(total, 'one', kpath) THEN
SET total = JSON_REPLACE(total, kpath, JSON_EXTRACT(total, kpath) + v);
ELSE
SET total = JSON_SET(total, kpath, v);
END IF;
SET knum = knum + 1;
END LOOP kloop;
RETURN total;
END
El procedimiento, count_keys
, realiza el equivalente de GROUP BY
cláusula. Encuentra todos los valores distintos de col1
en la tabla y luego llama a json_sum_merge
para cada fila que tiene ese valor de col1
. Tenga en cuenta que la consulta de selección de fila realiza un SELECT ... INTO
una variable ficticia para que no se genere ningún resultado y utiliza un MIN()
para asegurarse de que solo haya un resultado (para que pueda asignarse a una variable).
El procedimiento:
DELIMITER //
DROP PROCEDURE IF EXISTS count_keys //
CREATE PROCEDURE count_keys()
BEGIN
DECLARE finished INT DEFAULT 0;
DECLARE col1val VARCHAR(20);
DECLARE col1_cursor CURSOR FOR SELECT DISTINCT col1 FROM table2;
DECLARE CONTINUE HANDLER FOR NOT FOUND SET finished=1;
OPEN col1_cursor;
col1_loop: LOOP
FETCH col1_cursor INTO col1val;
IF finished=1 THEN
LEAVE col1_loop;
END IF;
SET @total = '{}';
SET @query = CONCAT("SELECT MIN(@total:=json_sum_merge(col2, @total)) INTO @json FROM table2 WHERE col1='", col1val, "'");
PREPARE stmt FROM @query;
EXECUTE stmt;
DEALLOCATE PREPARE stmt;
SELECT col1val AS col1, @total AS col2;
END LOOP col1_loop;
END
Para un ejemplo un poco más grande:
col1 col2
aaa {"key1": 1, "key2": 3}
bbb {"key1": 4, "key2": 2}
aaa {"key1": 50, "key3": 0}
ccc {"key2": 5, "key3": 1, "key4": 3}
bbb {"key1": 5, "key2": 1, "key5": 3}
CALL count_keys()
produce:
col1 col2
aaa {"key1": 51, "key2": 3, "key3": 0}
bbb {"key1": 9, "key2": 3, "key5": 3}
ccc {"key2": 5, "key3": 1, "key4": 3}
Tenga en cuenta que he llamado a la tabla table2
en el procedimiento, deberá editar eso (en ambas consultas) para adaptarlo.