Washington Post faz experiências com IA, mas estabelece limites

Brincar com IA generativa é um negócio sério para o The Washington Post. A maioria das pessoas considera o ChatGPT uma ferramenta experimental e está se acostumando com suas excentricidades e erros. Mas grandes modelos linguísticos (LLMs) como o ChatGPT têm um histórico infeliz de inventar histórias, algo inaceitável para qualquer editor preocupado com a integridade e precisão jornalística.

"Para nós, como uma empresa de notícias, é inaceitável", diz Sam Han, diretor de IA e machine learning do The Washington Post e CEO da Zeus Technology. No entanto, à medida que os leitores se adaptam a novas formas de obter informações, como interfaces de conversação, "queremos oferecer-lhes opções semelhantes".

Não exceder os limites

Para manter os LLMs à distância, o Washington Post estabeleceu diretrizes. Por exemplo, se você perguntar ao ChatGPT sobre o impacto das mudanças climáticas na economia, ele poderá escanear informações on-line e produzir uma resposta não muito correta. Em vez disso, o Washington Post insere seletivamente fragmentos ou frases de seus próprios artigos no modelo para ter certeza de gerar uma resposta confiável.

O Washington Post está experimentando LLMs comerciais, como o ChatGPT da Open AI, o Google Bard e a implantação do GPT via AWS. Também está testando LLM de código aberto, incluindo variedades do LLaMA da Meta, para ver se eles podem ser refinados. "Não queremos estar tecnicamente presos a um modelo específico", sublinham a partir do meio.

Mas o Washington Post tem outra razão para estudar LLM de código aberto. "Assim, podemos ter nossa versão para processos confidenciais", diz Han. Até onde sabem, se um usuário acessa a interface web do ChatGPT, a OpenAI pode rastrear a conversa e usar os dados para fins de treinamento. Mas se alguém usar uma API, o OpenAI retém os dados por 10 dias para fins de depuração e, em seguida, os descarta.

Questões legais, como se LLMs estão se formando em dados do Post sem permissão, são questões políticas que estão sob a alçada do Grupo de Trabalho de IA do jornal.

Não se inova sem experimentar

No final de maio, o Washington Post anunciou a criação de duas equipes multifuncionais focadas em IA. O grupo de trabalho para a IA define as orientações e prioridades para a política em matéria de IA. Este comité diretor pode dizer que um ser humano tem de estar no circuito antes de o Washington Post publicar qualquer conteúdo gerado por IA ou que o conteúdo gerado por IA deve incluir uma declaração de exoneração de responsabilidade ou notificação clara declarando-se como tal. Han lidera o AI Hub do The Washington Post, uma equipe operacional que coleta ideias relacionadas à IA de toda a organização e lança provas de conceito (POCs) para as ideias mais promissoras.

A equipa apresenta POCs ao Grupo de Trabalho de IA. Se for alcançado um consenso para colocar certos POCs em produção, o AI Hub os atribui às equipes apropriadas. O AI Hub apresentou algumas ideias viáveis, como um chatbot que poderia responder às perguntas dos leitores, uma ferramenta de documentação automatizada e uma ferramenta de geração de títulos. Um pequeno subconjunto de escritores está atualmente avaliando a viabilidade da geração de manchetes de IA.

Mas o Washington Post não é estranho à IA. Anteriormente, ele construiu modelos de aprendizado de máquina para executar uma série de tarefas, como prever a propensão e o volume de negócios da assinatura, moderar comentários, recomendar artigos aos leitores e realizar análises de sentimento.

E durante o ciclo eleitoral de 2016, o jornal criou um sistema automático de geração de conteúdo chamado Heliograf que pegou dados em tempo real da Associated Press para criar automaticamente atualizações sobre centenas de eleições para governador e estado. Heliograf mais tarde se expandiu para outras áreas de cobertura, como esportes locais, antes de o Washington Post desistir porque "a tecnologia não estava lá", disse Han. "A linguagem não era boa o suficiente."

Atualmente, o Washington Post está testando modelos de IA generativa contra seus modelos tradicionais de aprendizado de máquina. Seu modelo de análise de sentimento, que o Washington Post usa para alimentar as recomendações dos leitores e atender às necessidades dos anunciantes, é um exemplo disso.

Historicamente, um cientista de dados passava três ou quatro meses construindo um modelo, após o qual o Washington Post coletava dados usando o Amazon Mechanical Turk. Três a cinco revisores classificaram manualmente os artigos de acordo com sua opinião.

Agora, o Washington Post entrega uma chave de API a um desenvolvedor de software, que pode compartilhar um exemplo de artigo positivo e negativo com um LLM e pedir ao modelo para classificar o sentimento de um novo artigo. No entanto, ainda não se sabe se o novo modelo pode superar o anterior, porque os testes apenas começaram.

Aspirações de IA

Ainda assim, o Washington Post tem grandes ambições. Na "redação do futuro", diz Han, todo jornalista poderia ter um assistente de IA que coleta, analisa e resume informações para artigos. Ao longo do processo de escrita e edição, o agente de IA pode fazer sugestões sobre o texto ou títulos, gerar resumos diferentes e traduzir o artigo em vários idiomas.

"Na fase de distribuição, também vejo muito potencial", diz Han, como gerar diferentes versões de um item para diferentes públicos. Você também pode reempacotar o conteúdo original em diferentes formatos para o TikTok ou Facebook.

Outra área em que a IA pode brilhar é facilitar interações mais personalizadas entre leitores e repórteres. De acordo com Han, um avatar de um jornalista que adota sua voz poderia interagir com os leitores em tempo real, coletar informações dessas conversas e devolvê-las ao jornalista.

Han reconhece que meios de comunicação como o The Washington Post têm muitos obstáculos práticos e técnicos quando se trata de tecnologias de IA. Assim como as redes sociais mudaram a forma como consumimos informação, o ChatGPT e seus seguidores modificarão os hábitos e gostos de leitura de maneiras difíceis de prever.

Fonte: Adexchanger