¿Cómo crear una tabla de árbol sin una relación cíclica?

Probablemente la implementación SQL más simple y más común de un árbol es una tabla autorreferencial, por ejemplo:

create table tree(
    id int primary key, 
    parent int references tree(id));

insert into tree values
    (1, null),
    (2, 1),
    (3, 1),
    (4, 2),
    (5, 4);

Puede recorrer el árbol de arriba a abajo con una consulta recursiva como esta:

with recursive top_down as (
    select id, parent, array[id] as path
    from tree
    where parent is null
union all
    select t.id, t.parent, path || t.id
    from tree t
    join top_down r on t.parent = r.id
select *
from top_down;

 id | parent |   path    
  1 |        | {1}
  2 |      1 | {1,2}
  3 |      1 | {1,3}
  4 |      2 | {1,2,4}
  5 |      4 | {1,2,4,5}
(5 rows)

Ver también esta respuesta para un ejemplo de abajo hacia arriba.


No puede eliminar un nodo que es el padre de otro. La clave externa evita que el árbol se divida en partes separadas:

delete from tree
where id = 2;

ERROR:  update or delete on table "tree" violates foreign key constraint "tree_parent_fkey" on table "tree"
DETAIL:  Key (id)=(2) is still referenced from table "tree".    

Opcionalmente, puede asegurarse de que el árbol tenga solo una raíz usando un índice único parcial:

create unique index tree_one_root_idx on tree ((parent is null)) where parent is null;

insert into tree
values(6, null);

ERROR:  duplicate key value violates unique constraint "tree_one_root_idx"
DETAIL:  Key ((parent IS NULL))=(t) already exists. 


Puede eliminar la posibilidad de ingresar ciclos usando un disparador. La función comprueba si uno de los ancestros de un nodo insertado o actualizado podría ser el propio nodo:

create or replace function before_insert_or_update_on_tree()
returns trigger language plpgsql as $$
declare rec record;
    if exists(
        with recursive bottom_up as (
            select new.id, new.parent, array[]::int[] as path, false as cycle
        union all
            select r.id, t.parent, path || t.id, new.id = any(path)
            from tree t
            join bottom_up r on r.parent = t.id and not cycle
        select *
        from bottom_up
        where cycle or (id = parent))
    then raise exception 'Cycle detected on node %.', new.id;
    end if;
    return new;
end $$;

create trigger before_insert_or_update_on_tree
before insert or update on tree
for each row execute procedure before_insert_or_update_on_tree();


insert into tree values (6, 7), (7, 6);

ERROR:  Cycle detected on node 7.

update tree
set parent = 4
where id = 2;

ERROR:  Cycle detected on node 2.