Post in evidenza

Robot Apocalypse

Professor Stephen Hawking has pleaded with world leaders to keep technology under control before it destroys humanity.

venerdì 23 gennaio 2015

Robot Journalism

I robot entrano nelle redazioni dei media. Non per pulire i tavoli o scopare i pavimenti a fine giornata, ma per scrivere gli articoli che già leggiamo, senza sapere che dietro non c’è la mano di un essere umano. 


Il caso più clamoroso, ma non l’unico, è quello dell’agenzia americana di notizie Associated Press. Lou Ferrara, managing editor che gestisce le notizie economiche, ha annunciato che dal primo di luglio i report sugli annunci delle aziende riguardo i loro risultati finanziari li scriverà un software di nome Wordsmith, prodotto dalla compagnia Automated Insights di Robbie Allen, già dipendente di Cisco. In base ad un algoritmo, Wordsmith scorrerà i dati forniti dalle compagnie su ricavi e perdite, per individuare gli elementi più interessanti. Quindi li trasformerà in articoli brevi, compresi fra 150 e 300 parole, scritti secondo lo stile giornalistico classico e codificato della AP. Questo consentirà di aumentare enormemente la produzione. Oggi l’Associated Press pubblica circa 300 articoli ogni trimeste sugli earnings delle aziende: dal prossimo, diventeranno 4.400. Oltre dieci volte di più, al solo costo di acquisto del programma. 

Ferrara i giornalisti dell’agenzia hanno reagito con il sano scetticismo tipico del loro mestiere, ma non sono necessariamente contrari. L’azienda infatti ha promesso che non userà i robot per licenziare gli esseri umani, ma per reindirizzare le loro capacità migliori. In sostanza i robot svolgeranno i compiti più noiosi e scontati, liberando così gli uomini, che potranno dedicare più tempo ed energie agli articoli complessi e interessanti. Alcuni pezzi sugli earnings verranno ancora scritti dai giornalisti, ma solo nei casi più complessi, come quelli di aziende tipo Apple o Google: la routine quotidiana la gestirà il software da solo. 

Il Los Angeles Times da tempo ha adottato una tecnologia simile, per pubblicare gli articoli brevi di breaking news. Quando c’è un terremoto, ad esempio, invece di far perdere tempo ai reporter che devono andare sul posto a raccontarlo dal vivo, ci pensa il robot ad inviare in pochi minuti il pezzo iniziale sull’annuncio della notizia. La Northwestern University ha sviluppato Narrative Science, che produce articoli sul baseball e sui ricavi delle aziende. Yahoo utilizza Wordsmith per il suo sito di “fantasy football”, dove inventa storie originali. Il programma infatti viene sempre aggiornato, e ora i robot sono capaci anche di scherzare ed esprimere emozioni, o fingerle, un po’ come faceva nel film “Her” la ragazza virtuale interpretata da Scarlett Johannson, di cui si innamora Joaquin Phoenix. 

L’uso dei robot è molto più diffuso di quanto potremmo sospettare. L’anno scorso Wordsmith ha prodotto in totale 300 milioni di articoli, dal fantasy football ai financial reports, ma quest’anno arriverà a circa un miliardo di pezzi. 

E in America il robot entra in redazione PAOLO MASTROLILLI 02/07/2014

The rise of automated journalism10 Jul 2014


Nel mondo totalmente disumanizzato del romanzo 1984George Orwell immagina che gli scrittori non esistano più: sono stati cancellati, triturati nel gigantesco ingranaggio burocratico che distrugge identità, memoria, storia, pensiero, e la stessa consapevolezza di essere stati umani. In loro assenza, i testi letterari vengono prodotti da macchine. La protagonista femminile lavora in un reparto speciale del Ministero della Verità (Dipartimento narrativo) e ha un incarico tecnico presso una delle macchine per scrivere(Macchine componi-romanzi).

La procedura ha alcune fasi: dapprima una Commissione Progetti impartisce le direttive generali; poi un caleidoscopio, azionato da un grande macchinario, assembla secondo uno schema combinatorio alcuni elementi precostituiti. Quindi interviene l'Unità Riscrittura e distribuisce sul prodotto un'adeguata patina letteraria. Nel gigantesco meccanismo di gestione del potere non si tratta, come potrebbe sembrare, di un ingranaggio marginale, perché la produzione meccanizzata di fiction non ha solo lo scopo di svagare, distrarre o procurare esperienze estetiche in serie: essa costituisce anche l'altro risvolto della menzogna, parte integrante del controllo del pensiero, impresa complementare al sistematico processo di riscrittura della storia perseguito dal Ministero della Verità. Tanto è vero che i romanzi sono soltanto uno dei filoni di una gigantesca e pianificata produzione culturale che comprende giornali, film, dizionari, libri di testo, programmi televisivi, musiche, commedie, nonché «canzonette sentimentali che venivano composte secondo un procedimento del tutto meccanico, per mezzo d'una sorta di caleidoscopio che si chiamava versificatore». 

«La fine dei giornali è una delle cose più prevedibili del nostro futuro ,gli unici che non lo sanno ancora sono i giornalisti». Così, a metà novembre, Gianroberto Casaleggio lanciava il suo anatema sul futuro della stampa, uccisa dal cosiddetto robot journalism. Presto i giornalisti saranno rimpiazzati da web robot (o semplicemente bot), software in grado di scrivere articoli al posto loro, ma in quantità nettamente superiori. Forse anche con migliore accuratezza.

In fondo «robot journalism è il nuovo nome affibbiato a un problema di cui si parla dagli anni ’90, quando scoppiò il caso del Daily Me, un giornale virtuale personalizzato», ci ricorda Stefano Epifani, docente di Social Media Management a La Sapienza. Non è altro che il secolare dibattito sul rapporto uomo-macchina in versione 2.0.

La tecnologia per la scrittura automatica deve molto agli specialisti in intelligenza artificiale della Northwestern University dell’Illinois. Larry Birnbaum e Kris Hammond, docenti di Informatica e fondatori della start-up Narrative Science, hanno inventato Quill, uno dei primi sistemi per la produzione di testi brevi ma di senso compiuto, senza intermediazione umana. «Sulla base di algoritmi che rispondono a specifiche funzioni, il software comincia con l’importazione di dati – perlopiù su finanza o sport, che si limitano a riportare nomi e numeri – da aggregatori esterni. Si va dai database governativi a Twitter, come già avviene per l’analisi del consenso in occasione di tornate elettorali», spiega Alessio Cimarellidata scientist e cofondatore della rete Dataninja. Liste, tabelle e grafici vengono quindi convertiti, in modo che siano funzionali a una costruzione narrativa. Infine si costruiscono frasi semplici ma leggibili, con la lingua di tutti i giorni o termini tecnici, coerenti con la linea editoriale del giornale che acquista il servizio. Il risultato è una notizia di 150-300 parole. Tutto avviene in una manciata di secondi. Automaticamente.

Nell’era digitale dei Big Data ci siamo appena entrati: aumenteranno esponenzialmente e da soli non possiamo sfruttarli. Un computer non ha margine di errore, analizza enormi quantità di dati e svolge simultaneamente più lavori. Senza stancarsi mai. Può sostituire il personale adibito alle news e fornire una mole di informazioni almeno 15 volte superiore. Tutto a un prezzo più basso. Non è un caso che molti altri giornali statunitensi, tra cui Huffington PostSport IllustratedBusiness Insider e ProPublica abbiano scelto di sperimentare il robot journalism. «Abbiamo ancora intenzione di usare i nostri cervelli e il nostro tempo in maniera più efficiente», assicurava Ferrara. Secondo una buona parte di addetti ai lavori, i bot non possono che essere un bene per la professione. I redattori avrebbero modo di rinunciare a lavori alienanti per concentrarsi su contenuti più complessi, come inchieste, reportage, commenti e recensioni.

«Le storie che i bot possono scrivere oggi sono, francamente, quelle che gli umani odiano scrivere», commenta Kevin Roose, ex redattore del New York Times. «Se il Times avesse usato un algoritmo per i rapporti trimestrali invece di passare la palla a giornalisti in erba, avrei potuto investire le mie mattinate su lavori che richiedono una reale intelligenza umana». Certo, molti potrebbero perdere il lavoro, ma i giornalisti dovranno essere sempre più bravi a produrre contenuti e a costruirsi un seguito. Del resto, oltre al fantasma del robot journalism, sono le stesse dinamiche del web a imporlo.

Il grosso del materiale prodotto dai media in rete è rappresentato da articoli brevi e facilmente leggibili, relativi a fatti e dichiarazioni specifiche. In una parola, notizie. L’avvento di internet ha significato aumento dello spazio e contrazione del tempo, così la repentina evoluzione dell’informazione online si è basata sulla prolificazione e sulla tempestività di nuovi contenuti. Oggi ci sentiamo soggetti a un bombardamento mediatico. Se già negli anni ’90 il cittadino medio non era interessato alle news, nel 2014 si è assuefatto. Non è questo che gli utenti vogliono dalla rete. «Ad attirarli sono interpretazioni che rispecchino le loro opinioni e i loro gusti – dice il professor Epifani – Seriose o divertenti, mediocri o di qualità, l’importante è che siano curate e, perché no, personalizzate».

Non è un caso che tutti i giornali online, chi più chi meno, abbiano lasciato ampio spazio ai blog personali e che quelli gestiti da personaggi importanti, o semplicemente abili, abbiano più seguito della stessa testata che li ospita. È sulla scia di queste tendenze che vanno osservati l’aumento di articoli sempre più lunghi e curati dal punto di vista multimediale (il cosiddetto long journalism), la diffusione di contenuti spiccatamente narrativi (lo storytelling), o il successo di progetti editoriali come Huffington Post, primo a investire davvero sui blog, eBuzzFeed, il fenomeno da 300 milioni di visitatori mensili che ha puntato tutto su freddure e format disimpegnati ma altamente leggibili.

A fare la differenza sarà tutto ciò che una macchina non può avere: qualità, originalità ed elasticità. Il mondo dell’informazione, dunque, avrà confini meno solcati ma sarà più selettivo. Offrendo a chi ne sarà in grado l’occasione di reinventarsi, uscire dagli schemi e non farsi rubare il lavoro da alcun computer. Con la crescente disponibilità di dati, inevitabilmente le notizie aumenteranno, ma con scopi altri rispetto alla fruizione da parte di un utente. Grazie alle visualizzazioni da parte degli utenti e alla propagazione attraverso i social media, produrranno a loro volta dati che un altro sistema potrebbe analizzare. Secondo il sociologo bielorusso ed esperto di nuovi media Evgenij Morozov, docente invitato alla Stanford University, in gran parte «sarà giornalismo fatto dai bot per i bot».

La domanda di contenuti più ricercati a cui i giornali stanno cercando di rispondere, però, si colloca in un contesto più ampio. «Oggi gli utenti pretendono tutela della privacy, protezione da virus e spam, ma anche di ricevere informazioni e visualizzare contenuti più vicini ai loro reali interessi», ci spiega Alessio Cimarelli. «Non è un caso che di recente Facebook e Twitter abbiano modificato in questo senso gli algoritmi che determinano che cosa vediamo dai nostri account». Sono gli stessi ad aver costruito, insieme a Google, un modello di business fondato su dati personali che gli internauti rilasciano effettuando ricerche tramite i browser, interagendo sui social network e acquistando in rete. Ancora Big Data.

Con queste informazioni i colossi del web sono in grado di far visualizzare a ogni singolo utente contenuti selezionati appositamente in base alle sue inclinazioni, sempre in automatico. E quando si tratta di pubblicità mirata, un inserzionista che punta a un preciso target di consumatori pagherà. La merce di scambio è l'utente. I colossi del web potrebbero andare oltre la pubblicità e l’aggregazione di notizie esterne, sviluppando un servizio di contenuti informativi prodotti in casa e studiati ad personam. Si tratta di incrociare i dati sulla personalità dell’utente con quelli provenienti dalle fonti d’informazione primaria. E l’algoritmo che individua i contenuti da far visualizzare con quello che creerebbe le news.

«Nel 2025 il 90% delle notizie lette dal pubblico saranno generate dai computer e la quantità di materiale pubblicato crescerà enormemente», ha affermato il fondatore di Narrative Science, Kris Hammond. «Un giorno ci sarà soltanto un lettore per ciascun articolo». Del resto, assicura il vice-presidente di Automated Insights Adam Smith, «partendo agli stessi dati, possiamo formulare milioni di storie diverse» in base alle necessità e ai destinatari. Non solo, gli articoli arriverebbero direttamente all’utente, che non dovendo cercarseli svolgerà un ruolo meno attivo e finirà col ricevere notizie sempre dalle stesse fonti, comunque affini al suo modo di pensare.

«Un circolo vizioso», lo definisce Evgenij Morozov. «Molte persone potrebbero consumare informazioni spazzatura e avere soltanto piccoli indizi dell’esistenza di un mondo diverso e più intelligente». Con l’impressione di non essersi persi nulla grazie a quella «natura comunitaria dei social media», che limita le interazioni degli utenti alla cerchia più ristretta di amici e persone che seguono, amalgamando opinioni affini. Tra i più ascoltati critici dell’internet-centrismo, Morozov ha ipotizzato le conseguenze che potrebbero avere sistemi avanzati di robot journalism nelle mani di aziende come Google e Amazon. «La vera minaccia viene dal nostro rifiuto di investigare le conseguenze sociali e politiche del vivere in un mondo che rende impossibile leggere qualcosa in forma anonima. Un mondo che gli inserzionisti e i giganti del web non vedono l’ora di occupare, in cui sarà più difficile preservare il pensiero critico, erudito e non convenzionale», seppellito dal senso comune sulla cui formazione proprio quei giganti avranno sempre più potere.

Narrative Science. Per trasformare Quill – uno dei primi algoritmi scrittori – in un prodotto da vendere, Kris Hammond ha fondato Narrative Science, start-up di riferimento nel nascente settore della generazione automatica di testi. Nell'ambito del robot journalism ha un contratto con la celebre rivista americana Forbes per le news finanziare. Ma sul fronte dell'analisi dei Big Data lavora anche con MasterCard, Credit Suisse e altre importanti compagnie.

Automated Insights. A contendersi la seadership del settore con Narrative Science è questa società del Nord Carolina. Ha cominciato nel 2010 con la produzione di cronache sportive col nome di StatSheet e nel 2013 è arrivata a produrre oltre 300 milioni di testi. Forte delle collaborazioni con colossi come Yahoo News, Microsoft e Samsung, prevede di raggiungere il miliardo entro la fine di quest’anno. Il suo algoritmo, Wordsmith, è quello utilizzato da Associated Press per le notizie sulle compagnie quotate in borsa.

Quakebot. Anche il Los Angeles Times, per dare prima di tutti la notizia dei frequenti terremoti nella regione, si è dotato di un algoritmo. Quakebot pesca i dati dalle mail di avviso inviate dall’US Geological Survey e li inserisce in un testo pronto per la pubblicazione, con una sorta di firma: «questo articolo è stato creato da un algoritmo scritto dall’autore». Nell’ultimo anno, però, proprio il quotidiano californiano ha licenziato diversi giornalisti per problemi economici.

Yseop. Società francese che opera anche in Texas, ha sviluppato un sistema in grado di parlare inglese, francese, spagnolo, portoghese e presto giapponese. Yseop lavora per banche e società di telecomunicazioni, nell'ambito dei servizi offerti ai clienti, ma anche per siti di notizie gestiti da società finanziarie e agenzie investigative sui trend di mercato.

Labsense. Il marketing online è un altro campo in cui i bot scrittori sono già al lavoro. Questa piccola startup parigina collabora con siti di e-commerce e cataloghi, fornendo un algoritmo che mette insieme i dettagli, schede tecniche e manuali d'uso di innumerevoli prodotti, da elettrodomestici ad alberghi, per comporre una breve descrizione esplicativa. L'azienda ha costruito un corpus di terminologia corrispondente ai principali settori coinvolti nel trading on line, tra cui viaggi, elettronica e intrattenimento.

Il giornalismo salvato dai web robot FEDERICO GENNARI SANTORI 31 dicembre 2014 

An investment from In-Q-Tel, the CIA’s investment division, led the company to work from multiple U.S. intelligence agencies. Asked about that work, Frankel says only that “The communication challenges of the U.S. intelligence community are very similar to those of our other customers.” Altogether, Quill now churns out millions of words per day.
The software’s output can be impressive for software, but it can’t write without some numerical data for inspiration. It performs statistical analysis on that data, looking for significant events or trends, and it draws on knowledge about key concepts such as bankruptcy, profit, and revenue, and how such concepts are related.
The following paragraph, from an investment report, shows that Quill can write passable text for such a document, but it can still feel as if it were written by a computer.
“The energy sector was the main contributor to relative performance, led by stock selection in energy equipment and services companies. In terms of individual contributors, a position in energy equipment and services company Oceaneering International was the largest contributor to returns. Stock selection also contributed to relative results in the health care sector. Positioning in health care equipment and supplies industry helped most.”
Quill is programmed with rules of writing that it uses to structure sentences, paragraphs, and pages, says Kristian Hammond, a computer science professor at Northwestern University and chief scientist at Narrative Science. “We know how to introduce an idea, how not to repeat ourselves, how to get shorter,” he says.
Companies can also tune Quill’s style and use of language based on what they need it to write. It can accentuate the positive in marketing copy, or go for exhaustive detail in a regulatory filing, for example.



Quill can also take an “angle” for a piece of writing. When writing about sports for an audience likely to favor a particular team, for instance, Quill can write a story that softens the blow of a loss.
Narrative Science doesn’t publish technical details of how Quill works. But Michael White, an associate professor at Ohio State University, says that its ability to finesse the angle and arc of a piece sets it apart from previous examples of such software.
What is known as “natural language generation” software has been a research topic for years, but it has recently begun to show more commercial promise, says White. “There’s growing awareness that masses of data and visualizations are not really helpful if they can’t be explained and made relevant,” says White. “I’d say the time has finally become ripe for natural language generation to have commercial success.”
Other companies working on the technology include Arria, a U.K.-based company that was spun out of research from the University of Aberdeen, in Scotland. A Pittsburgh startup called OnlyBoth, founded last year, plans to launch its first writing software products later in 2015.
All those companies are so far focused on serving businesses. But Hammond says that as cars, health gadgets, and home appliances become connected to the Internet, the simple charts and symbols they use to communicate with humans may not be enough. “Most households are not going to be able to do the data science to make to their thermostats and cars and other data intelligible,” says Hammond. “This technology is going to be a descriptive voice of everything that has data.”

Robot Journalist Finds New Work on Wall Street 



Posta un commento
Share/Save/Bookmark
Related Posts Plugin for WordPress, Blogger...

Ratings by outbrain

PostRank