Análise do framework de IA: da agência inteligente à Descentralização
Introdução
A velocidade de desenvolvimento da pista de Agentes de IA é impressionante. Desde que o "Terminal da Verdade" desencadeou a onda de Agentes, a narrativa da combinação entre IA e criptomoedas tem mudado quase toda semana. Recentemente, o foco do mercado se voltou para projetos "de estrutura" dominados por tecnologia, e esse segmento gerou vários projetos com capitalização de mercado superior a cem milhões e até um bilhão em apenas algumas semanas. Esses projetos também deram origem a um novo modelo de emissão de ativos, onde os projetos emitem moedas a partir de repositórios de código no Github, e os Agentes desenvolvidos com base na estrutura também podem emitir moedas novamente. Com base na estrutura, os Agentes atuam como aplicações de camada superior, formando um modelo semelhante a uma plataforma de emissão de ativos, que na verdade está formando um modelo de infraestrutura exclusivo para a era da IA. Este artigo interpretará o impacto potencial da estrutura de IA no campo das criptomoedas, partindo do conceito básico de estrutura e combinando reflexões pessoais.
I. Definição e Classificação do Quadro
A estrutura de IA é uma ferramenta ou plataforma de desenvolvimento de baixo nível que integra um conjunto de módulos, bibliotecas e ferramentas pré-construídas, simplificando o processo de construção de modelos de IA complexos. Essas estruturas geralmente contêm funcionalidades para processar dados, treinar modelos e fazer previsões. De forma simples, a estrutura pode ser entendida como o sistema operacional da era da IA, semelhante aos sistemas operacionais de desktop como Windows, Linux, ou os sistemas móveis como iOS e Android. Cada estrutura tem suas vantagens e desvantagens, e os desenvolvedores podem escolher de acordo com as necessidades específicas.
Embora o "framework de IA" seja um conceito emergente no campo das criptomoedas, considerando sua origem, o desenvolvimento dos frameworks de IA já se aproxima de 14 anos desde o surgimento do Theano em 2010. No campo da IA tradicional, tanto na academia quanto na indústria, já existem frameworks muito maduros disponíveis, como o TensorFlow do Google, o Pytorch da Meta, o PaddlePaddle da Baidu e o MagicAnimate da ByteDance, que têm suas vantagens em diferentes cenários.
Atualmente, os projetos de estrutura que estão surgindo no campo das criptomoedas são desenvolvidos com base na alta demanda por agentes devido à atual onda de IA, e se estendem a outros campos das criptomoedas, formando, no final, diferentes estruturas de IA em nichos distintos. Abaixo estão algumas introduções a estruturas principais:
1.1 Eliza
Eliza é uma estrutura de simulação multi-Agent, projetada para criar, implantar e gerenciar Agentes de IA autônomos. É desenvolvida em TypeScript, com boa compatibilidade e capacidade de integração de API. Eliza é principalmente direcionada a cenários de redes sociais, suportando integração em várias plataformas, incluindo Discord, X/Twitter, Telegram, entre outras. Na área de processamento de conteúdo de mídia, suporta leitura e análise de documentos PDF, extração e resumo de conteúdo de links, transcrição de áudio, processamento de conteúdo de vídeo, análise e descrição de imagens, bem como resumo de diálogos.
Os casos de uso atualmente suportados pelo Eliza incluem principalmente aplicações de assistentes de IA, personagens de redes sociais, trabalhadores do conhecimento e personagens interativos, entre outros. Em termos de suporte a modelos, o Eliza pode utilizar modelos de código aberto para inferência local, bem como pode usar a API da OpenAI para inferência em nuvem, com a configuração padrão sendo Nous Hermes Llama 3.1B, e integrado com Claude para consultas complexas.
1.2 G.A.M.E
G.A.M.E é uma estrutura de IA multimodal gerada e gerida automaticamente lançada pela Virtual, principalmente direcionada ao design de NPCs inteligentes em jogos. A característica desta estrutura é que usuários com uma base de baixo código ou mesmo sem código também podem utilizá-la, bastando que o usuário modifique os parâmetros para participar do design do Agent.
O design central do G.A.M.E é uma design modular que trabalha em colaboração através de múltiplos subsistemas, incluindo a interface de dicas do Agente, subsistema de percepção, motor de planejamento estratégico, contexto do mundo, módulo de processamento de diálogos, operador de carteira em cadeia, módulo de aprendizagem, memória de trabalho, processador de memória de longo prazo, repositório de Agentes, planejador de ações e executor de planos.
Do ponto de vista da arquitetura técnica, esta estrutura concentra-se principalmente nas decisões, feedback, percepção e personalidade do Agente em ambientes virtuais, sendo aplicável não só a cenários de jogo, mas também a aplicações do metaverso.
1.3 Rig
Rig é uma ferramenta open source escrita em Rust, concebida para simplificar o desenvolvimento de aplicações de grandes modelos de linguagem (LLM). Ela fornece uma interface de operação unificada, permitindo que os desenvolvedores interajam facilmente com vários fornecedores de LLM (, como OpenAI e Anthropic ), assim como com várias bases de dados vetoriais (, como MongoDB e Neo4j ).
As características principais do Rig incluem uma interface unificada, uma arquitetura modular, segurança de tipos e desempenho eficiente. Suporta um modo de programação assíncrona, otimiza a capacidade de processamento concorrente e possui funcionalidades de registro e monitoramento integradas.
O Rig não é apenas adequado para construir sistemas de resposta a perguntas que requerem respostas rápidas e precisas, mas também pode ser usado para criar ferramentas de busca de documentos eficientes, chatbots ou assistentes virtuais com capacidade de percepção contextual, e até mesmo apoiar a criação de conteúdo, gerando automaticamente texto ou outras formas de conteúdo com base em padrões de dados existentes.
1.4 ZerePy
ZerePy é um framework open source baseado em Python, destinado a simplificar o processo de implantação e gestão de Agentes de IA na plataforma Twitter( anterior ao X). Ele herda as funcionalidades principais do projeto Zerebro, mas adota um design mais modular e mais fácil de expandir.
ZerePy oferece uma interface de linha de comando (CLI), facilitando aos usuários gerenciar e controlar seus Agentes de IA implantados. Sua arquitetura central é baseada em um design modular, suportando grandes modelos de linguagem (LLM) da OpenAI e da Anthropic, integrando diretamente a API da plataforma X, e planejando integrar um sistema de memória no futuro.
Embora ZerePy e Eliza estejam ambos empenhados em construir e gerir Agentes de IA, os dois diferem ligeiramente em termos de arquitetura e objetivos. Eliza foca mais na simulação de múltiplos agentes e na investigação ampla de IA, enquanto ZerePy se concentra em simplificar o processo de implementação de Agentes de IA na plataforma social específica (X), tendendo mais para a simplificação em aplicações práticas.
II. Caminho de Desenvolvimento do Agente de IA e Comparação com o Ecossistema BTC
O caminho de desenvolvimento dos Agentes de IA tem muitas semelhanças com o ecossistema BTC no final de 2023 e no início de 2024. O desenvolvimento do ecossistema BTC pode ser resumido como: competição entre múltiplos protocolos como BRC20-Atomical/Rune - BTC L2 - BTCFi com Babylon como núcleo. Por outro lado, os Agentes de IA estão se desenvolvendo mais rapidamente sobre uma pilha de tecnologia de IA tradicional madura, e seu caminho pode ser resumido como: GOAT/ACT - Agentes sociais - Agentes de IA analíticos - competição de estruturas. No futuro, projetos de infraestrutura desenvolvidos em torno da Descentralização dos Agentes e da segurança podem se tornar o tema principal da próxima fase.
No entanto, é pouco provável que a pista do AI Agent se torne homogênea e inflacionada como o ecossistema BTC. A narrativa do AI Agent não visa reproduzir a história das cadeias de contratos inteligentes; os projetos de estrutura de AI existentes, independentemente de sua força técnica, oferecem pelo menos uma nova abordagem para o desenvolvimento de infraestrutura. Em vez de comparar a estrutura de AI a plataformas de emissão de ativos, e o Agent a ativos, acredito que a estrutura de AI se assemelha mais a uma futura blockchain pública, enquanto o Agent se assemelha mais a um futuro Dapp.
No atual ecossistema de criptomoedas, temos milhares de blockchains públicas e dezenas de milhares de Dapps. As blockchains gerais incluem BTC, Ethereum e várias blockchains heterogêneas, enquanto as blockchains de aplicação são ainda mais diversificadas, como blockchains de jogos, blockchains de armazenamento, blockchains Dex, entre outras. As blockchains públicas e as estruturas de IA são essencialmente muito semelhantes, e os Dapps também podem corresponder bem aos Agentes.
No campo das criptomoedas na era da IA, é muito provável que se desenvolva nessa direção. Os debates futuros podem mudar de discussões sobre EVM e cadeias heterogêneas para disputas de frameworks. A questão agora está mais centrada em como alcançar a Descentralização ou a encadeação, e qual é o significado de desenvolver frameworks de IA na blockchain. Projetos de infraestrutura de IA subsequentes podem começar a explorar com base nesses fundamentos.
Três, o significado de ir para a cadeia
Quando a blockchain se combina com qualquer área, precisa enfrentar uma questão central: essa combinação tem significado? Em artigos anteriores, o autor criticou a inversão de prioridades do GameFi e a questão do desenvolvimento de infraestrutura excessivamente avançado. Quanto à combinação de IA e criptomoeda, o autor também expressou pessimismo em relação à combinação IA x Crypto nos campos práticos na fase atual.
Ao revisitar o caminho de sucesso do DeFi, podemos notar que o DeFi conseguiu conquistar uma parte do setor financeiro tradicional devido à sua maior acessibilidade, melhor eficiência e custos mais baixos, além da segurança que não requer instituições centralizadas de confiança. Seguindo essa linha de raciocínio, as razões para apoiar a cadeia de Agentes podem incluir:
A cadeia do Agente pode alcançar um custo de uso mais baixo, permitindo assim uma maior acessibilidade e opções? Isso pode, em última instância, permitir que os usuários comuns também participem do "direito de aluguel" de IA, que é exclusivo das grandes empresas do Web2.
Em termos de segurança, se o Agente puder intervir em carteiras reais ou virtuais, então uma solução de segurança baseada em blockchain pode se tornar uma necessidade.
O Agent pode implementar um conjunto de jogadas financeiras exclusivas da blockchain? Por exemplo, semelhante aos LPs em AMM, permitindo que pessoas comuns participem na criação automática de mercado; ou com base nos recursos necessários ao Agent, como poder computacional, marcação de dados, etc., os usuários podem investir no protocolo na forma de stablecoins.
Na atual ausência de perfeita interoperabilidade no DeFi, se um agente baseado em blockchain puder realizar raciocínio transparente e rastreável, isso pode ser mais atraente do que os navegadores de agentes oferecidos pelos gigantes da internet tradicionais.
Quatro, novas oportunidades na economia criativa
Projetos de tipo estrutura podem oferecer no futuro uma oportunidade de empreendedorismo semelhante à GPT Store. Embora atualmente a publicação de Agentes através da estrutura ainda seja bastante complexa para os usuários comuns, simplificar o processo de construção de Agentes e fornecer uma estrutura de combinações de funcionalidades complexas pode vir a ter uma vantagem no futuro, formando assim uma economia criativa Web3 mais interessante do que a GPT Store.
O atual GPT Store tende a ser prático em áreas tradicionais, e a maioria dos aplicativos populares é criada por empresas tradicionais do Web2, com a receita sendo dominada pelos criadores. Em comparação, o Web3 ainda possui muitas áreas a serem preenchidas em termos de demanda, e no sistema econômico pode tornar as políticas injustas dos gigantes do Web2 mais justas. Além disso, a introdução da economia comunitária também pode tornar os Agentes mais completos.
A economia criativa da Agent oferecerá oportunidades de participação para pessoas comuns, e os futuros Memes de IA poderão ser mais inteligentes e interessantes do que os Agents emitidos nas plataformas atuais. Isso abre uma nova direção de desenvolvimento para o ecossistema Web3, com potencial para estimular mais inovação e participação.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
8 Curtidas
Recompensa
8
4
Compartilhar
Comentário
0/400
SellLowExpert
· 18h atrás
Perda de corte Reabastecimento de margem da 58ª vez... ainda consigo me levantar
Ver originalResponder0
ShibaOnTheRun
· 18h atrás
Ser enganado por idiotas novo truque?
Ver originalResponder0
LiquidatorFlash
· 18h atrás
O indicador de risco do mercado de agentes frenéticos acendeu a luz vermelha, a posição de empréstimo desviou do limite em 4,2%, uma pancada está prestes a acontecer.
Novas tendências em frameworks de IA: da inteligência artificial para a economia criativa Web3
Análise do framework de IA: da agência inteligente à Descentralização
Introdução
A velocidade de desenvolvimento da pista de Agentes de IA é impressionante. Desde que o "Terminal da Verdade" desencadeou a onda de Agentes, a narrativa da combinação entre IA e criptomoedas tem mudado quase toda semana. Recentemente, o foco do mercado se voltou para projetos "de estrutura" dominados por tecnologia, e esse segmento gerou vários projetos com capitalização de mercado superior a cem milhões e até um bilhão em apenas algumas semanas. Esses projetos também deram origem a um novo modelo de emissão de ativos, onde os projetos emitem moedas a partir de repositórios de código no Github, e os Agentes desenvolvidos com base na estrutura também podem emitir moedas novamente. Com base na estrutura, os Agentes atuam como aplicações de camada superior, formando um modelo semelhante a uma plataforma de emissão de ativos, que na verdade está formando um modelo de infraestrutura exclusivo para a era da IA. Este artigo interpretará o impacto potencial da estrutura de IA no campo das criptomoedas, partindo do conceito básico de estrutura e combinando reflexões pessoais.
I. Definição e Classificação do Quadro
A estrutura de IA é uma ferramenta ou plataforma de desenvolvimento de baixo nível que integra um conjunto de módulos, bibliotecas e ferramentas pré-construídas, simplificando o processo de construção de modelos de IA complexos. Essas estruturas geralmente contêm funcionalidades para processar dados, treinar modelos e fazer previsões. De forma simples, a estrutura pode ser entendida como o sistema operacional da era da IA, semelhante aos sistemas operacionais de desktop como Windows, Linux, ou os sistemas móveis como iOS e Android. Cada estrutura tem suas vantagens e desvantagens, e os desenvolvedores podem escolher de acordo com as necessidades específicas.
Embora o "framework de IA" seja um conceito emergente no campo das criptomoedas, considerando sua origem, o desenvolvimento dos frameworks de IA já se aproxima de 14 anos desde o surgimento do Theano em 2010. No campo da IA tradicional, tanto na academia quanto na indústria, já existem frameworks muito maduros disponíveis, como o TensorFlow do Google, o Pytorch da Meta, o PaddlePaddle da Baidu e o MagicAnimate da ByteDance, que têm suas vantagens em diferentes cenários.
Atualmente, os projetos de estrutura que estão surgindo no campo das criptomoedas são desenvolvidos com base na alta demanda por agentes devido à atual onda de IA, e se estendem a outros campos das criptomoedas, formando, no final, diferentes estruturas de IA em nichos distintos. Abaixo estão algumas introduções a estruturas principais:
1.1 Eliza
Eliza é uma estrutura de simulação multi-Agent, projetada para criar, implantar e gerenciar Agentes de IA autônomos. É desenvolvida em TypeScript, com boa compatibilidade e capacidade de integração de API. Eliza é principalmente direcionada a cenários de redes sociais, suportando integração em várias plataformas, incluindo Discord, X/Twitter, Telegram, entre outras. Na área de processamento de conteúdo de mídia, suporta leitura e análise de documentos PDF, extração e resumo de conteúdo de links, transcrição de áudio, processamento de conteúdo de vídeo, análise e descrição de imagens, bem como resumo de diálogos.
Os casos de uso atualmente suportados pelo Eliza incluem principalmente aplicações de assistentes de IA, personagens de redes sociais, trabalhadores do conhecimento e personagens interativos, entre outros. Em termos de suporte a modelos, o Eliza pode utilizar modelos de código aberto para inferência local, bem como pode usar a API da OpenAI para inferência em nuvem, com a configuração padrão sendo Nous Hermes Llama 3.1B, e integrado com Claude para consultas complexas.
1.2 G.A.M.E
G.A.M.E é uma estrutura de IA multimodal gerada e gerida automaticamente lançada pela Virtual, principalmente direcionada ao design de NPCs inteligentes em jogos. A característica desta estrutura é que usuários com uma base de baixo código ou mesmo sem código também podem utilizá-la, bastando que o usuário modifique os parâmetros para participar do design do Agent.
O design central do G.A.M.E é uma design modular que trabalha em colaboração através de múltiplos subsistemas, incluindo a interface de dicas do Agente, subsistema de percepção, motor de planejamento estratégico, contexto do mundo, módulo de processamento de diálogos, operador de carteira em cadeia, módulo de aprendizagem, memória de trabalho, processador de memória de longo prazo, repositório de Agentes, planejador de ações e executor de planos.
Do ponto de vista da arquitetura técnica, esta estrutura concentra-se principalmente nas decisões, feedback, percepção e personalidade do Agente em ambientes virtuais, sendo aplicável não só a cenários de jogo, mas também a aplicações do metaverso.
1.3 Rig
Rig é uma ferramenta open source escrita em Rust, concebida para simplificar o desenvolvimento de aplicações de grandes modelos de linguagem (LLM). Ela fornece uma interface de operação unificada, permitindo que os desenvolvedores interajam facilmente com vários fornecedores de LLM (, como OpenAI e Anthropic ), assim como com várias bases de dados vetoriais (, como MongoDB e Neo4j ).
As características principais do Rig incluem uma interface unificada, uma arquitetura modular, segurança de tipos e desempenho eficiente. Suporta um modo de programação assíncrona, otimiza a capacidade de processamento concorrente e possui funcionalidades de registro e monitoramento integradas.
O Rig não é apenas adequado para construir sistemas de resposta a perguntas que requerem respostas rápidas e precisas, mas também pode ser usado para criar ferramentas de busca de documentos eficientes, chatbots ou assistentes virtuais com capacidade de percepção contextual, e até mesmo apoiar a criação de conteúdo, gerando automaticamente texto ou outras formas de conteúdo com base em padrões de dados existentes.
1.4 ZerePy
ZerePy é um framework open source baseado em Python, destinado a simplificar o processo de implantação e gestão de Agentes de IA na plataforma Twitter( anterior ao X). Ele herda as funcionalidades principais do projeto Zerebro, mas adota um design mais modular e mais fácil de expandir.
ZerePy oferece uma interface de linha de comando (CLI), facilitando aos usuários gerenciar e controlar seus Agentes de IA implantados. Sua arquitetura central é baseada em um design modular, suportando grandes modelos de linguagem (LLM) da OpenAI e da Anthropic, integrando diretamente a API da plataforma X, e planejando integrar um sistema de memória no futuro.
Embora ZerePy e Eliza estejam ambos empenhados em construir e gerir Agentes de IA, os dois diferem ligeiramente em termos de arquitetura e objetivos. Eliza foca mais na simulação de múltiplos agentes e na investigação ampla de IA, enquanto ZerePy se concentra em simplificar o processo de implementação de Agentes de IA na plataforma social específica (X), tendendo mais para a simplificação em aplicações práticas.
II. Caminho de Desenvolvimento do Agente de IA e Comparação com o Ecossistema BTC
O caminho de desenvolvimento dos Agentes de IA tem muitas semelhanças com o ecossistema BTC no final de 2023 e no início de 2024. O desenvolvimento do ecossistema BTC pode ser resumido como: competição entre múltiplos protocolos como BRC20-Atomical/Rune - BTC L2 - BTCFi com Babylon como núcleo. Por outro lado, os Agentes de IA estão se desenvolvendo mais rapidamente sobre uma pilha de tecnologia de IA tradicional madura, e seu caminho pode ser resumido como: GOAT/ACT - Agentes sociais - Agentes de IA analíticos - competição de estruturas. No futuro, projetos de infraestrutura desenvolvidos em torno da Descentralização dos Agentes e da segurança podem se tornar o tema principal da próxima fase.
No entanto, é pouco provável que a pista do AI Agent se torne homogênea e inflacionada como o ecossistema BTC. A narrativa do AI Agent não visa reproduzir a história das cadeias de contratos inteligentes; os projetos de estrutura de AI existentes, independentemente de sua força técnica, oferecem pelo menos uma nova abordagem para o desenvolvimento de infraestrutura. Em vez de comparar a estrutura de AI a plataformas de emissão de ativos, e o Agent a ativos, acredito que a estrutura de AI se assemelha mais a uma futura blockchain pública, enquanto o Agent se assemelha mais a um futuro Dapp.
No atual ecossistema de criptomoedas, temos milhares de blockchains públicas e dezenas de milhares de Dapps. As blockchains gerais incluem BTC, Ethereum e várias blockchains heterogêneas, enquanto as blockchains de aplicação são ainda mais diversificadas, como blockchains de jogos, blockchains de armazenamento, blockchains Dex, entre outras. As blockchains públicas e as estruturas de IA são essencialmente muito semelhantes, e os Dapps também podem corresponder bem aos Agentes.
No campo das criptomoedas na era da IA, é muito provável que se desenvolva nessa direção. Os debates futuros podem mudar de discussões sobre EVM e cadeias heterogêneas para disputas de frameworks. A questão agora está mais centrada em como alcançar a Descentralização ou a encadeação, e qual é o significado de desenvolver frameworks de IA na blockchain. Projetos de infraestrutura de IA subsequentes podem começar a explorar com base nesses fundamentos.
Três, o significado de ir para a cadeia
Quando a blockchain se combina com qualquer área, precisa enfrentar uma questão central: essa combinação tem significado? Em artigos anteriores, o autor criticou a inversão de prioridades do GameFi e a questão do desenvolvimento de infraestrutura excessivamente avançado. Quanto à combinação de IA e criptomoeda, o autor também expressou pessimismo em relação à combinação IA x Crypto nos campos práticos na fase atual.
Ao revisitar o caminho de sucesso do DeFi, podemos notar que o DeFi conseguiu conquistar uma parte do setor financeiro tradicional devido à sua maior acessibilidade, melhor eficiência e custos mais baixos, além da segurança que não requer instituições centralizadas de confiança. Seguindo essa linha de raciocínio, as razões para apoiar a cadeia de Agentes podem incluir:
A cadeia do Agente pode alcançar um custo de uso mais baixo, permitindo assim uma maior acessibilidade e opções? Isso pode, em última instância, permitir que os usuários comuns também participem do "direito de aluguel" de IA, que é exclusivo das grandes empresas do Web2.
Em termos de segurança, se o Agente puder intervir em carteiras reais ou virtuais, então uma solução de segurança baseada em blockchain pode se tornar uma necessidade.
O Agent pode implementar um conjunto de jogadas financeiras exclusivas da blockchain? Por exemplo, semelhante aos LPs em AMM, permitindo que pessoas comuns participem na criação automática de mercado; ou com base nos recursos necessários ao Agent, como poder computacional, marcação de dados, etc., os usuários podem investir no protocolo na forma de stablecoins.
Na atual ausência de perfeita interoperabilidade no DeFi, se um agente baseado em blockchain puder realizar raciocínio transparente e rastreável, isso pode ser mais atraente do que os navegadores de agentes oferecidos pelos gigantes da internet tradicionais.
Quatro, novas oportunidades na economia criativa
Projetos de tipo estrutura podem oferecer no futuro uma oportunidade de empreendedorismo semelhante à GPT Store. Embora atualmente a publicação de Agentes através da estrutura ainda seja bastante complexa para os usuários comuns, simplificar o processo de construção de Agentes e fornecer uma estrutura de combinações de funcionalidades complexas pode vir a ter uma vantagem no futuro, formando assim uma economia criativa Web3 mais interessante do que a GPT Store.
O atual GPT Store tende a ser prático em áreas tradicionais, e a maioria dos aplicativos populares é criada por empresas tradicionais do Web2, com a receita sendo dominada pelos criadores. Em comparação, o Web3 ainda possui muitas áreas a serem preenchidas em termos de demanda, e no sistema econômico pode tornar as políticas injustas dos gigantes do Web2 mais justas. Além disso, a introdução da economia comunitária também pode tornar os Agentes mais completos.
A economia criativa da Agent oferecerá oportunidades de participação para pessoas comuns, e os futuros Memes de IA poderão ser mais inteligentes e interessantes do que os Agents emitidos nas plataformas atuais. Isso abre uma nova direção de desenvolvimento para o ecossistema Web3, com potencial para estimular mais inovação e participação.