Índice
- Introdução
- A confiança na mídia tradicional está diminuindo
- Como funciona o NewsNotFound
- Transparência
- Conclusão
- Referências
Introdução
O cenário da mídia de hoje é fortemente polarizado e sensacionalista, com muitas fontes de notícias sendo acusadas de promover sua própria agenda e enganar seus leitores.
As organizações de notícias não são mais vistas como fontes confiáveis de informação, e a confiança do público em geral na mídia tradicional vem diminuindo constantemente há anos.
A ascensão da internet e da mídia social permitiu que notícias falsas e desinformação se espalhassem como fogo, e a necessidade de fontes de notícias confiáveis e imparciais nunca foi tão grande.
NewsNotFound é uma plataforma de notícias totalmente transparente.
Todos os artigos de notícias são gerados por IA com base em dados de notícias em tempo real, incluindo imagem de capa, conteúdo e manchete.
Todo o código-fonte está disponível publicamente em GitHub para que qualquer pessoa possa ver exatamente o que acontece nos bastidores da criação do artigo.
Ao substituir o intermediário humano por nosso processo de criação de artigos centrado em IA, podemos reduzir e controlar o potencial de viés e garantir que toda a cobertura permaneça imparcial.
Nossa missão é liderar o caminho no jornalismo de IA, fornecendo artigos de notícias neutros e imparciais que podem ser governados pelo público. Queremos construir a plataforma de notícias mais imparcial da internet.
O principal problema que estamos tentando resolver com este projeto é o monopólio que algumas das maiores empresas de mídia têm sobre a informação do mundo, com total liberdade (e muitas vezes incentivo) para polarizar e sensacionalizar sua cobertura de notícias para aumentar os cliques e ganhar mais atenção .
A confiança na mídia tradicional está diminuindo
O declínio da confiança na mídia tradicional é uma tendência preocupante que vem sendo observada em todo o mundo.
No Reino Unido, apenas 34% dos adultos dizem confiar nas notícias. Nos Estados Unidos, esse número é ainda menor em 26%.
Essa falta de confiança é agravada pelo aumento no número de pessoas que evitam ler as notícias, com a porcentagem de pessoas evitando ativamente as notícias no Reino Unido aumentando de 24% em 2017 para 46% em 2022.
Um grande problema com as notícias que se destacaram nos últimos anos é a presença de informações falsas ou enganosas.
Em fevereiro de 2022, na América do Norte, 53% de adultos relataram ter visto informações falsas ou enganosas sobre o COVID-19 nas notícias na última semana, enquanto na Europa esse número foi de 47%.
Essas estatísticas revelam até que ponto o público foi exposto a notícias falsas, o que pode trazer sérias consequências para a saúde pública, segurança e democracia.
Mesmo as fontes de notícias tradicionalmente confiáveis não são imunes à desconfiança do público. Por exemplo, de 2018 a 2022, a parcela de pessoas que disseram confiar na BBC caiu de 75% para 55%.
A pandemia apenas exacerbou o problema das notícias falsas, com 80% de adultos nos EUA relatando ter visto notícias falsas sobre a pandemia de COVID-19. Além disso, enquanto 65% dos americanos confiam plenamente nos meios de comunicação tradicionais, 27% acreditam que os principais meios de comunicação relatam notícias falsas.
Um fator que contribui para a disseminação de notícias falsas é a forma como elas são divulgadas.
Por exemplo, postagens no Facebook de fontes de desinformação recebem seis vezes mais engajamento, em média, do que sites de notícias respeitáveis.
Isso enfatiza a importância de identificar e abordar as fontes de notícias falsas, bem como desenvolver métodos para promover a disseminação de informações precisas.
Como funciona o NewsNotFound
Para uma especificação técnica completa sobre como nossa plataforma funciona, por favor veja nosso repositório do GitHub aqui.
No centro de nossa plataforma está um processo totalmente automatizado para gerar artigos de notícias imparciais. Nesta seção, forneceremos um breve detalhamento de como nosso site funciona, passo a passo, para lhe dar uma ideia do que exatamente se passa em cada artigo que publicamos.
Passo 1: para cada categoria, começamos coletando as últimas manchetes de sites de notícias disponíveis publicamente.
Passo 2: usando a incorporação de frases, identificamos todas as manchetes relacionadas e as escolhemos como o assunto do artigo. A ideia aqui é que, se uma história tiver várias manchetes relacionadas em diferentes fontes, é mais provável que seja de maior importância do que uma história com nenhuma ou apenas uma manchete relacionada. Isso nos ajuda a determinar em qual história focar e sobre a qual escrever um artigo.
etapa 3: assim que tivermos uma lista de manchetes relacionadas, usaremos o GPT-3 para gerar uma lista de fatos, não opiniões, que estão presentes em cada um dos respectivos artigos da manchete. Esta etapa garante que nossos artigos sejam baseados apenas em informações factuais, não em especulações ou opiniões.
Passo 4: Com esses fatos, usamos o GPT-3 para gerar um resumo do artigo que combina todas as informações disponíveis sobre a história. Usamos o prompt abaixo para fazer isso:
“Eu tenho esta lista python de marcadores, onde cada item da lista é uma coleção diferente de fatos pontuados por marcadores sobre uma notícia que foi gerada pelo GPT3 a partir de vários artigos de notícias raspados diferentes sobre a história. Seu trabalho é filtrar e combinar esses fatos e gerar um resumo muito detalhado e informativo para um repórter de notícias com base em todos os fatos e informações disponíveis sobre a notícia. Não deixe de fora nenhuma informação. Sua única saída deve ser o resumo para que possa ser armazenado como uma string em python.\n\n {bullet_points}”
Passo 5: Agora pedimos ao GPT-4 para gerar um artigo de notícias completo e imparcial com base no resumo usando o seguinte prompt:
“Com base no resumo abaixo, por favor, gere-me um artigo de notícias completo para uso no site de uma empresa de notícias. O artigo deve ser completamente imparcial e escrito de um ponto de vista neutro. Por favor, faça o artigo o mais longo e detalhado possível, com o máximo de informações que puder. Não escreva nenhuma conclusão. Não faça suposições nem acrescente linguagem sugestiva. Atenha-se estritamente aos fatos fornecidos a você no resumo. Por favor, escreva no formato de pirâmide invertida e coloque o conteúdo de forma que cada frase seja seu próprio parágrafo. Tente também garantir que não mais do que 25% de frases contenham mais de 20 palavras:\n\n{breve}”
Esse prompt garante que o artigo seja o mais imparcial possível e escrito de um ponto de vista neutro. Ele também orienta o GPT-4 a usar o formato de pirâmide invertida, garantindo que as informações mais importantes sejam apresentadas primeiro.
Passo 6: Em seguida, passamos o artigo por meio de um “verificador de viés”, que usa a análise de sentimento para classificar a polaridade de sentimento do artigo gerado. Uma classificação de 0 é extremamente negativa, 10 é extremamente positiva e 5 é completamente neutra.
Passo 7: Se a classificação do viés não for igual a 5, passamos cada parágrafo do artigo para GPT-3 e pedimos que ele remova quaisquer instâncias de viés e reescreva o parágrafo para que fique neutro, usando o seguinte prompt:
“Você deve assumir o papel de revisor e editor de artigos de uma empresa de notícias imparcial. Seu trabalho é examinar o parágrafo abaixo e garantir que ele seja 100% neutro e imparcial. Se você encontrar quaisquer ocorrências de palavras/frases tendenciosas ou linguagem positiva/negativa, você deve reescrevê-las ou reformulá-las de maneira completamente imparcial e neutra. Procure ser factual, não opinativo. Se um parágrafo já for neutro e imparcial, apenas imprima o parágrafo original.\n\n{para}”.
Esse processo é repetido até que o artigo receba uma classificação de viés de 5 ou atinja um limite de recursão.
OBSERVAÇÃO: Os passos 6 e 7 foram removidos temporariamente a partir de 19/04/23. Isso foi implementado quando usamos o GPT-3 para gerar o artigo; no entanto, o GPT-4 parece ser muito mais consistente na produção de artigos imparciais. Usar o verificador de viés com GPT-4 estava prejudicando a qualidade do artigo, por isso está aguardando melhorias.
Passo 8: assim que tivermos um artigo imparcial, nós o formatamos para que cada frase fique em uma nova linha, melhorando a legibilidade e evitando que o texto seja agrupado em um parágrafo grande.
Passo 9: agora pedimos ao GPT-3 para gerar um título para o artigo usando o seguinte prompt:
“Você deve assumir o papel de revisor e editor de artigos de uma empresa de notícias imparcial. Seu trabalho é olhar o artigo abaixo e gerar um título 100% neutro e imparcial. O título deve usar uma linguagem completamente neutra e imparcial. Procure ser factual, não opinativo. Mantenha o título o mais curto possível (de preferência não mais que 10 palavras). O título não precisa ser excessivamente descritivo, apenas precisa informar ao leitor rapidamente qual é o assunto do artigo. Basta enviar o título.\n\n{artigo}”
Passo 10: Todos os artigos têm duas seções principais: 'Em resumo' e 'Os detalhes'.
Todo o artigo que acabou de ser gerado vai para a seção 'Os detalhes'.
Aqui, pedimos ao GPT-3 para gerar cinco marcadores que melhor resumam o artigo para ir para a seção 'Resumo'.
Essa etapa garante que nossos artigos sejam facilmente legíveis e fornece aos leitores uma compreensão clara das informações mais importantes do evento de notícias sem ter que vasculhar parágrafos de texto.
Passo 11: Finalmente, usamos Stable Diffusion para gerar uma imagem de capa para o artigo usando a seguinte estrutura de prompt:
“uma imagem moderna e altamente detalhada no estilo de uma pintura a óleo que melhor visualiza a seguinte manchete de notícias: {manchete}”.
A razão pela qual especificamos 'uma pintura a óleo' é para que os usuários não confundam imagens geradas por IA com imagens reais, pois é muito mais provável que uma pintura a óleo seja vista como 'a percepção de um artista' do evento e não como uma imagem realista.
As etapas acima são todas executadas de acordo com uma programação para cada categoria, portanto, a cada dia deve haver um novo lote de artigos imparciais adicionados ao nosso site. Há muito mais etapas técnicas entre as descritas acima, mas tentamos fornecer uma breve visão geral de como nossa plataforma funciona de forma que todos possam entender.
Transparência
Desde abril de 2023, todo o nosso código-fonte está disponível para visualização no GitHub.
Isso garante a máxima transparência com os usuários de nossa plataforma e permite que qualquer pessoa contribua com o projeto e destaque quaisquer problemas/melhorias.
Acreditamos que esta é a chave para uma empresa de notícias confiável – permitir que os usuários vejam e tenham controle sobre nossa arquitetura técnica.
Se você tiver alguma sugestão de melhoria ou se tiver detectado algum bug, abra um problema no nosso repositório GitHub.
Conclusão
Nossa plataforma visa fornecer notícias imparciais aos leitores, uma necessidade premente no mundo de hoje, onde a confiança na mídia está em baixa. Nosso sistema emprega técnicas de inteligência artificial para coletar as últimas notícias de várias fontes e gerar artigos completamente neutros e imparciais.
Ao automatizar o processo de reportagem de notícias, eliminamos o risco de viés e erro humano e fornecemos aos usuários informações precisas e objetivas.
Acreditamos que nossa plataforma pode ajudar a restaurar a confiança nas notícias e promover uma sociedade mais informada e unida.
Referências
- Estatista – Parcela de adultos que confiam na mídia na maior parte do tempo em países selecionados em todo o mundo em fevereiro de 2022.
- Instituto Reuters para o Estudo do Jornalismo (RISJ) – Relatório de Notícias Digitais 2022.
- Estatista – Consumidores de notícias que viram informações falsas ou enganosas sobre tópicos selecionados na última semana em todo o mundo em fevereiro de 2022, por região.
- Estatista – Confiança em marcas de mídia de serviço público em mercados selecionados em todo o mundo em 2018 e 2022.
- Statista, The Economist, Business Insider (via TechJury) – Estatísticas de notícias falsas 2023.
Ultima atualização: