Os especialistas em cadeia de cadeia LLM são melhores que o MOE (mistura de especialistas) com os custos de memória e cálculo em ordem.

Link da fonte