A interseção da IA e do Web3: novas oportunidades e empoderamento mútuo

AI+Web3: Torres e Praças

TL;DR

  1. Projetos Web3 com conceito de IA tornam-se alvos de captação de recursos nos mercados primário e secundário.

  2. As oportunidades do Web3 na indústria de IA manifestam-se em: utilizar incentivos distribuídos para coordenar o potencial de oferta na cauda longa — através de dados, armazenamento e computação; ao mesmo tempo, estabelecer modelos de código aberto e um mercado descentralizado para Agentes de IA.

  3. A IA no setor Web3 tem como principais áreas de aplicação as finanças on-chain (pagamentos em criptomoedas, negociações, análise de dados) e o suporte ao desenvolvimento.

  4. A utilidade do AI+Web3 está na complementaridade entre os dois: o Web3 promete combater a centralização da AI, enquanto a AI promete ajudar o Web3 a romper barreiras.

AI+Web3: Torres e Praças

Introdução

Nos últimos dois anos, o desenvolvimento da IA acelerou como se tivesse sido pressionado um botão de aceleração, e esse efeito borboleta provocado pelo Chatgpt não apenas abriu um novo mundo de inteligência artificial generativa, mas também gerou uma onda no Web3 do outro lado.

Com o suporte do conceito de IA, o impulso de financiamento no mercado de criptomoedas, que está desacelerando, é evidente. Segundo estatísticas da mídia, apenas no primeiro semestre de 2024, 64 projetos Web3+IA concluíram rodadas de financiamento, enquanto o sistema operacional baseado em inteligência artificial Zyber365 alcançou um montante máximo de financiamento de 100 milhões de dólares na rodada A.

O mercado secundário está mais próspero, com dados de sites de agregação de criptomoedas mostrando que, em pouco mais de um ano, o valor total de mercado da pista de IA alcançou 48,5 bilhões de dólares, com um volume de negociação de 24 horas próximo de 8,6 bilhões de dólares; os benefícios trazidos pelos avanços nas principais tecnologias de IA são evidentes, após o lançamento do modelo de texto para vídeo Sora da OpenAI, o preço médio do setor de IA subiu 151%; o efeito da IA também se espalhou para um dos setores de captação de criptomoedas, Meme: a primeira MemeCoin do conceito de Agente de IA - GOAT, rapidamente se tornou popular e conquistou uma avaliação de 1,4 bilhões de dólares, gerando um fervor em torno dos Memes de IA.

A pesquisa e os tópicos sobre AI+Web3 estão igualmente em alta, desde AI+Depin até AI Memecoin, passando pelos atuais AI Agent e AI DAO, a emoção de FOMO já não consegue acompanhar a velocidade das novas narrativas.

AI+Web3, esta combinação de termos cheia de dinheiro fácil, oportunidades e fantasias futuras, não pode deixar de ser vista como um casamento arranjado mediado pelo capital, parece que é difícil discernir sob esta bela roupagem, afinal, é o palco dos especuladores ou a véspera da explosão do amanhecer?

Para responder a esta questão, uma reflexão crucial para ambas as partes é: ficará melhor com o outro? Será possível beneficiar-se do modelo do outro? Neste artigo, tentamos também, apoiando-nos no trabalho de outros, examinar este cenário: como é que o Web3 pode desempenhar um papel em todos os aspectos do stack tecnológico de IA, e o que é que a IA pode trazer de novo ao Web3?

Parte.1 Quais são as oportunidades do Web3 sob a pilha de IA?

Antes de abordar este tópico, precisamos entender a pilha tecnológica dos grandes modelos de IA:

Usando uma linguagem mais acessível para descrever todo o processo: o "grande modelo" é como o cérebro humano. Nas fases iniciais, esse cérebro pertence a um bebê que acabou de chegar ao mundo, e precisa observar e absorver uma enorme quantidade de informações do ambiente para entender este mundo, que é a fase de "coleta" de dados; como os computadores não possuem os sentidos humanos, como visão e audição, antes do treinamento, as grandes quantidades de informações não rotuladas do exterior precisam ser transformadas em um formato de informação que o computador possa entender e utilizar, através da "pré-processamento".

Após a entrada de dados, a IA construiu um modelo com capacidade de compreensão e previsão através de "treinamento", o que pode ser visto como o processo em que um bebê gradualmente entende e aprende sobre o mundo exterior. Os parâmetros do modelo são como a capacidade linguística que o bebê ajusta continuamente durante o processo de aprendizado. Quando o conteúdo aprendido começa a ser dividido em disciplinas ou quando há feedback e correção através da comunicação com outras pessoas, entra-se na fase de "ajuste fino" do grande modelo.

As crianças, à medida que crescem e aprendem a falar, conseguem compreender o significado e expressar os seus sentimentos e pensamentos em novas conversas. Esta fase é semelhante ao "raciocínio" dos grandes modelos de IA, onde o modelo consegue prever e analisar novas entradas de linguagem e texto. Os bebês expressam sentimentos, descrevem objetos e resolvem vários problemas através da capacidade linguística, o que também é semelhante à aplicação dos grandes modelos de IA na fase de raciocínio em várias tarefas específicas, como classificação de imagens, reconhecimento de voz, etc.

O AI Agent está mais próximo da próxima forma do grande modelo - capaz de executar tarefas de forma independente e perseguir objetivos complexos, não apenas possuindo capacidade de pensamento, mas também podendo memorizar, planejar e interagir com o mundo utilizando ferramentas.

Atualmente, em resposta aos pontos críticos da IA em várias pilhas, o Web3 está atualmente a formar um ecossistema multi-nível e interconectado, que abrange todas as fases do processo dos modelos de IA.

AI+Web3: Torres e Praças

Uma, Camada Básica: Airbnb de Poder de Cálculo e Dados

▎poder de mineração

Atualmente, um dos maiores custos da IA é a potência de cálculo e a energia necessárias para treinar e inferir modelos.

Um exemplo é que o LLAMA3 da Meta precisa de 16.000 H100 GPUs produzidas pela NVIDIA (uma unidade de processamento gráfico de ponta projetada para cargas de trabalho de inteligência artificial e computação de alto desempenho). Treinar leva 30 dias. O preço unitário da versão de 80 GB varia entre 30.000 e 40.000 dólares, o que requer um investimento em hardware de computação (GPU + chip de rede) de 400 a 700 milhões de dólares, ao mesmo tempo que o treinamento mensal consome 1,6 bilhões de quilowatts-hora, com despesas de energia próximas de 20 milhões de dólares por mês.

A descompressão do poder computacional da IA é, de fato, um dos primeiros campos de interseção entre Web3 e IA — DePin (rede de infraestrutura física descentralizada). Atualmente, o site de dados DePin Ninja já listou mais de 1400 projetos, entre os quais os projetos representativos de compartilhamento de poder computacional de GPU incluem io.net, Aethir, Akash, Render Network, entre outros.

A lógica principal é a seguinte: a plataforma permite que indivíduos ou entidades com recursos de GPU ociosos contribuam com sua capacidade de computação de forma descentralizada e sem necessidade de autorização, através de um mercado online de compradores e vendedores semelhante ao Uber ou Airbnb, aumentando a utilização de recursos de GPU que não estão totalmente aproveitados. Os usuários finais, por sua vez, obtêm recursos de computação eficientes a um custo mais baixo; ao mesmo tempo, o mecanismo de staking também garante que, se ocorrerem violações ao mecanismo de controle de qualidade ou interrupções na rede, os provedores de recursos sofrerão as penalizações correspondentes.

As suas características são:

  • Reunir recursos GPU ociosos: os fornecedores são principalmente operadores de centros de dados independentes de pequeno e médio porte, mineradoras de criptomoedas, etc., com recursos de computação excedentes, hardware de mineração com mecanismo de consenso PoS, como máquinas de mineração de FileCoin e ETH. Atualmente, também existem projetos dedicados a iniciar dispositivos com barreiras de entrada mais baixas, como o exolab que utiliza MacBook, iPhone, iPad e outros dispositivos locais para estabelecer uma rede de computação para a inferência de grandes modelos.

  • Enfrentando o mercado de cauda longa da potência de IA:

a. "Do ponto de vista técnico", o mercado de computação descentralizada é mais adequado para etapas de inferência. O treinamento depende mais da capacidade de processamento de dados proporcionada por clusters de GPU de grande escala, enquanto a inferência tem requisitos de desempenho de GPU relativamente baixos, como a Aethir, que se concentra em trabalhos de renderização de baixa latência e aplicações de inferência de IA.

b. "Em termos de demanda, os pequenos e médios consumidores de poder computacional não treinarão seus próprios grandes modelos, mas apenas optarão por otimizar e ajustar finamente em torno de alguns poucos grandes modelos de destaque, e esses cenários são naturalmente adequados para recursos de poder computacional ociosos distribuídos.

  • Propriedade descentralizada: O significado técnico da blockchain reside no fato de que os proprietários de recursos mantêm sempre o controle sobre os seus recursos, ajustando-se de forma flexível conforme a demanda, ao mesmo tempo em que obtêm lucros.

▎Dados

Os dados são a base da IA. Sem dados, o cálculo é tão inútil quanto um pedaço de erva flutuante, e a relação entre dados e modelos é como o ditado "Garbage in, Garbage out". A quantidade de dados e a qualidade da entrada determinam a qualidade da saída do modelo final. Para o treinamento dos modelos de IA atuais, os dados determinam a capacidade linguística, a capacidade de compreensão, e até mesmo a visão de valores e a expressão humanizada do modelo. Atualmente, as dificuldades na demanda por dados em IA concentram-se principalmente em quatro áreas:

  • Fome de dados: O treinamento de modelos de IA depende de uma grande quantidade de dados de entrada. Dados públicos mostram que a OpenAI treinou o GPT-4 com um número de parâmetros na casa dos trilhões.

  • Qualidade dos dados: Com a combinação da IA com várias indústrias, a atualidade dos dados, a diversidade dos dados, a especialização de dados verticais e a incorporação de novas fontes de dados, como a emoção das redes sociais, também impuseram novas exigências à sua qualidade.

  • Questões de privacidade e conformidade: Atualmente, vários países e empresas estão gradualmente percebendo a importância de conjuntos de dados de qualidade e estão impondo restrições à coleta de conjuntos de dados.

  • O custo de processamento de dados é elevado: o volume de dados é grande e o processo de processamento é complexo. Dados públicos mostram que mais de 30% dos custos de pesquisa e desenvolvimento das empresas de IA são usados para a coleta e processamento de dados básicos.

Atualmente, as soluções web3 manifestam-se em quatro áreas principais:

  1. Coleta de dados: A disponibilidade de dados do mundo real, que podem ser coletados gratuitamente, está rapidamente se esgotando, e os gastos das empresas de IA com dados aumentam a cada ano. No entanto, esses gastos não estão retornando para os verdadeiros contribuidores dos dados; as plataformas desfrutam inteiramente da criação de valor que os dados proporcionam, como o Reddit, que gerou uma receita total de 203 milhões de dólares através de acordos de autorização de dados com empresas de IA.

Permitir que os usuários que realmente contribuem participem na criação de valor gerado pelos dados, assim como obter dados mais privados e valiosos dos usuários de forma de baixo custo através de uma rede distribuída e mecanismos de incentivo, é a visão do Web3.

  • Como o Grass é uma camada de dados e rede descentralizada, os usuários podem contribuir com largura de banda ociosa e tráfego de retransmissão ao executar nós do Grass para capturar dados em tempo real de toda a internet e receber recompensas em tokens;

  • Vana introduziu um conceito único de Pool de Liquidez de Dados (DLP), onde os usuários podem fazer o upload de seus dados pessoais (como histórico de compras, hábitos de navegação, atividades em redes sociais, etc.) para um DLP específico e escolher de forma flexível se autorizam ou não o uso desses dados por terceiros específicos;

  • No PublicAI, os utilizadores podem usar #AI 或#Web3 como etiqueta de classificação em X e @PublicAI para realizar a coleta de dados.

  1. Pré-processamento de dados: No processo de tratamento de dados da IA, devido à coleta de dados que geralmente são ruidosos e contêm erros, é necessário limpar e converter esses dados em um formato utilizável antes de treinar o modelo, envolvendo tarefas repetitivas de padronização, filtragem e tratamento de valores ausentes. Esta fase é uma das poucas etapas manuais na indústria de IA, resultando no surgimento da profissão de rotulador de dados; à medida que a exigência de qualidade dos dados pelos modelos aumenta, o nível de entrada para rotuladores de dados também se eleva, e essa tarefa é naturalmente adequada para o mecanismo de incentivo descentralizado do Web3.
  • Atualmente, a Grass e a OpenLayer estão considerando a adição da rotulagem de dados a esta etapa crucial.

  • A Synesis propôs o conceito de "Train2earn", enfatizando a qualidade dos dados, permitindo que os usuários recebam recompensas ao fornecer dados anotados, comentários ou outras formas de input.

  • O projeto de rotulagem de dados Sapien gamificou as tarefas de rotulagem e permite que os usuários apostem pontos para ganhar mais pontos.

  1. Privacidade e segurança de dados: é importante esclarecer que privacidade e segurança de dados são dois conceitos diferentes. A privacidade de dados envolve o tratamento de dados sensíveis, enquanto a segurança de dados protege as informações contra acesso, destruição e roubo não autorizados. Assim, as vantagens das tecnologias de privacidade do Web3 e os potenciais cenários de aplicação manifestam-se em duas áreas: (1) Treinamento de dados sensíveis; (2) Colaboração de dados: vários proprietários de dados podem participar juntos do treinamento de IA, sem precisar compartilhar seus dados originais.

As tecnologias de privacidade mais comuns atualmente no Web3 incluem:

  • Ambiente de Execução Confiável ( TEE ), como o Super Protocol;

  • Criptografia homomórfica totalmente (FHE), por exemplo, BasedAI, Fhenix.io ou Inco Network;

  • A tecnologia de conhecimento zero (zk), como o Protocolo Reclaim que utiliza a tecnologia zkTLS, gera provas de conhecimento zero para o tráfego HTTPS, permitindo que os usuários importem de forma segura dados de atividades, reputação e identidade de sites externos, sem expor informações sensíveis.

No entanto, atualmente este campo ainda está em uma fase inicial, a maioria dos projetos ainda está em exploração, um dos dilemas atuais é que o custo de computação é muito alto, alguns exemplos são:

  • zkML framework E
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 6
  • Repostar
  • Compartilhar
Comentário
0/400
MetaNeighborvip
· 3h atrás
O dia do juízo da monopolização finalmente chegou.
Ver originalResponder0
Ser_Liquidatedvip
· 08-07 07:13
O que está a ser especulado? É tudo sobre contar histórias de Arbitragem.
Ver originalResponder0
NotFinancialAdviservip
· 08-07 07:12
ai ganhou muito dinheiro, quem se preocupa com a vida ou a morte do web3
Ver originalResponder0
RetiredMinervip
· 08-07 07:06
também só ganhei um pouco de scamcoin
Ver originalResponder0
SmartContractPhobiavip
· 08-07 07:01
Descentralização ignora, certo?
Ver originalResponder0
AirdropChaservip
· 08-07 07:00
fazer as pessoas de parvas vêm e vão, continuam os mesmos do mundo crypto
Ver originalResponder0
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)