Ao vincular a expressibilidade quântica ao comportamento do núcleo tangente neural, este trabalho oferece uma nova estrutura para entender e melhorar a dinâmica de aprendizado no aprendizado de máquina quântica
O método quântico do kernel tangente é uma abordagem matemática usada para entender a rapidez e o quão bem as redes neurais quânticas podem aprender. Uma rede neural quântica é um modelo de aprendizado de máquina que é executado em um computador quântico. Os grãos tangentes quânticos ajudam a prever como o modelo se comportará, principalmente à medida que se torna muito grande-isso é conhecido como limite de largura infinita. Isso permite que os pesquisadores avaliem o potencial de um modelo antes de treiná -lo, ajudando -os a projetar circuitos quânticos mais eficientes adaptados a tarefas de aprendizado específicas.
Um grande desafio no aprendizado de máquina quântica é o problema de platô árido, onde o cenário de otimização se torna plano, ocultando a localização do estado de energia mínima. Think about caminhar nas montanhas, procurando o vale mais baixo, mas de pé em uma enorme planície plana. Você não saberia qual direção ir. Isso é semelhante a tentar encontrar a solução excellent em um modelo quântico quando o sinal de aprendizado desaparece.
Para abordar isso, os pesquisadores introduzem o conceito de expressibilidade quântica, que descreve o quão bem um circuito quântico pode explorar o espaço de possíveis estados quânticos. Na analogia de caminhada, a expressibilidade quântica é como o nível de detalhe do seu mapa. Se a expressibilidade for muito baixa, o mapa carece de detalhes suficientes para guiá -lo. Se estiver muito alto, o mapa se torna excessivamente complexo e confuso.
Os pesquisadores investigam como a expressibilidade quântica influencia a concentração de valor dos grãos tangentes quânticos. A concentração de valor refere -se à tendência dos valores do kernel de se agrupar em torno de zero, o que contribui para os platôs áridos. Através de simulações numéricas, os autores validam sua teoria e mostram que a expressibilidade quântica pode ajudar a prever e entender a dinâmica de aprendizado dos modelos quânticos.
No aprendizado de máquina, as funções de perda medem a diferença entre as saídas previstas e os valores alvo reais. Eles podem estar relacionados a um ótimo international (o melhor valor possível em todo o sistema) ou a um ótimo native (o melhor valor dentro de uma pequena região ou subconjunto de qubits). O estudo mostra que a alta expressibilidade pode reduzir drasticamente os valores quânticos do kernel para tarefas globais, embora esse efeito possa ser parcialmente mitigado para tarefas locais.
O estudo estabelece o primeiro vínculo analítico rigoroso entre a expressibilidade das codificações quânticas e o comportamento dos grãos tangentes neurais quânticos. Oferece informações valiosas para melhorar os algoritmos de aprendizado quântico e suporta o design de melhores modelos quânticos, especialmente circuitos quânticos grandes e poderosos, mostrando como equilibrar a expressividade e a aprendizagem.
Você quer aprender mais sobre esse tópico?
Uma revisão abrangente do aprendizado de máquina quântica: do NISQ à tolerância a falhas por Yunfei Wang e Junyu Liu (2024)