frutas slots
Trabalhando como escritor para uma IA: um olhar para o futuro do jornalismo e da escrita
Para 🌟 algumas horas por semana, escrevo para uma empresa de tecnologia avaliada é pecado apostar em jogo de futebol bilhões de dólares. À minha volta, há novelistas 🌟 publicados, acadêmicos é pecado apostar em jogo de futebol ascensão e vários outros jornalistas freelancers. A carga de trabalho é flexível, a remuneração é melhor do 🌟 que estamos acostumados e as tarefas nunca acabam. Mas o que escrevemos nunca será lido por ninguém fora da empresa. 🌟
Isso porque não estamos escrevendo para pessoas. Estamos escrevendo para uma IA.
🌟 Modelos de linguagem de grande porte (LLMs) como o ChatGPT tornaram possível automatizar vastas áreas da vida linguística, 🌟 desde resumir qualquer quantidade de texto até redigir e-mails, ensaios e mesmo romances inteiros. Essas ferramentas parecem tão boas é pecado apostar em jogo de futebol 🌟 escrever que se tornaram sinônimos da própria ideia de inteligência artificial.
Mas antes que eles 🌟 corram o risco de levar a uma superinteligência divina ou a um desemprego maciço devastador, eles precisam de treinamento. Em 🌟 vez de usar esses chatbots grandiloquentes para nos automatizar fora de nossas profissões, as empresas de tecnologia estão contratando-nos para 🌟 ajudar a treinar seus modelos.
Treinando modelos de linguagem de grande porte
Além de fornecer à 🌟 nossa modelo "material-padrão-ouro", ajudamos a tentar evitar que ela "alucine" – contar mentiras
A parte 🌟 central do trabalho é escrever respostas falsas para perguntas hipotéticas de chatbot. Esses são os dados de treinamento que a 🌟 modelo precisa receber. A "IA" precisa de um exemplo do que "bom" se parece antes de tentar produzir "bom" escrita. 🌟
Além de fornecer à nossa modelo tal "material-padrão-ouro", também estamos ajudando a tentar evitar que 🌟 ela "alucine" – um termo poético para contar mentiras. Fazemos isso fornecendo-lhe exemplos que usam um motor de pesquisa e 🌟 citam fontes. Sem ver escrita que faça isso, ela não pode aprender a fazê-lo sozinha.
🌟 Sem melhores dados linguísticos, esses modelos de linguagem simplesmente não podem melhorar. Seu mundo é nossa palavra.
O fim 🌟 da palavra
E se os modelos forem treinados é pecado apostar em jogo de futebol dados sintéticos? Nossa internet ciborgue – co-autora por 🌟 nós e nossas máquinas de palavras – poderia então crescer indefinidamente.
Infelizmente, não é tão 🌟 simples. Treinar nossos atuais grandes modelos de linguagem é pecado apostar em jogo de futebol é pecado apostar em jogo de futebol própria saída não funciona. "Aprender indiscriminadamente de dados produzidos por 🌟 outros modelos causa 'colapso de modelo' – um processo degenerativo é pecado apostar em jogo de futebol que, ao longo do tempo, os modelos esquecem a 🌟 distribuição de dados subjacente verdadeira", escrevem Ilia Shumailov e colegas na Nature. Em outras palavras, eles saem dos trilhos e 🌟 tendem a produzir besteiras. Alimentar algo com é pecado apostar em jogo de futebol própria excreção leva à atrofia. Quem teria pensado?
🌟 Shumailov explicou a mim que cada vez que um modelo é treinado é pecado apostar em jogo de futebol dados sintéticos, ele perde consciência da 🌟 cauda longa de "dados minoritários" com os quais foi originalmente treinado (palavras raras, fatos incomuns, etc.). O conhecimento é erodido 🌟 e substituído apenas pelos pontos de dados mais prováveis – os LLMs são, à é pecado apostar em jogo de futebol essência, máquinas de predição de 🌟 texto sofisticadas. Portanto, quando os dados originais digitais são já tendenciosos – muito inglês, é pecado apostar em jogo de futebol grande parte centrados nos EUA 🌟 e cheios de postagens de fóruns pouco confiáveis – essa tendência será repetida.
Se os 🌟 dados sintéticos, produzidos por IAs, forem insuficientes para ajudar a melhorar os modelos, então eles precisarão de algo mais. Isso 🌟 é especialmente verdade à medida que as preocupações se espalham de que os modelos muito aclamados deixarão de ser capazes 🌟 de melhorar antes de eles sequer se tornarem úteis. As empresas de capital de risco precisarão preencher uma lacuna de 🌟 receita de R$500 bilhões até o final deste ano para agradar aos investidores. As máquinas de palavras podem ter fome; 🌟 o capital por trás delas também tem um apetite.
A OpenAI, o protetorado trillion-dollar da 🌟 Microsoft por trás do ChatGPT, assinou acordos de licenciamento – potencialmente valendo centenas de milhões de dólares – com muitas 🌟 das principais organizações de mídia do mundo, do News Corp ao Financial Times.
Mas não 🌟 é apenas uma questão de acumular mais dados originais. Essas empresas precisam do tipo de escrita que o modelo tentará 🌟 emular, não apenas absorver.
O papel dos anotadores humanos
Isso é onde os anotadores humanos entram 🌟 é pecado apostar em jogo de futebol cena.