“孤陳的城市在長夜中埋葬/他們記憶著最美麗的皇后/飄零在西落的太陽下/要先做一場夢……”這是微軟“小冰”在2017年5月出版的詩集《陽光失了玻璃窗》中的句子。據(jù)說,為了達成寫詩技能,“小冰”“學(xué)習(xí)”了上世紀(jì)20年代以來519位詩人的現(xiàn)代詩,被訓(xùn)練超過10000次。人類如果要把這些詩讀10000遍,則大約需要100年。
該詩集總策劃表示,作為剛出道的詩人,“小冰”或許還有不足。詩集原版呈現(xiàn)了“小冰”所有的創(chuàng)作文字,沒有潤色改動。詩句中的錯別字也有意保留,同時邊上用括號標(biāo)注。另外,部分詩歌可能讀起來會感到有重復(fù),“我們要讓人工智能100%的原生態(tài)地呈現(xiàn)在大家面前?!?/p>
AI遲早會介入到內(nèi)容生產(chǎn)領(lǐng)域中,首當(dāng)其沖的,并不是文學(xué)創(chuàng)作如寫詩,而是全天24小時生產(chǎn)各種資訊的媒體。從一些淺、快、短、格式化、需要與大量數(shù)據(jù)比對的資訊入手,AI正在替代編輯的工作。
我們檢索了幾類服務(wù)于不同媒體的AI產(chǎn)品,如下:
Reutres News Tracer在社交媒體“去偽存真”
近日,網(wǎng)易新聞“聞學(xué)社沙龍”以《人工智能將如何重塑新聞業(yè)》為主題,與專家學(xué)者共同探討AI對媒體行業(yè)的影響。分享會中,路透社的市場開發(fā)經(jīng)理王海明介紹了“Reutres News Tracer”。
過去兩年,路透社一直在Twitter 上用一款工具來監(jiān)測隨時出現(xiàn)的各類新聞事件、檢測社交媒體信息的真實性,這款產(chǎn)品叫“Reutres News Tracer”。
其工作流程為:搜集所有可能是新聞的信息,找到原始出處;找到第一轉(zhuǎn)發(fā)者;進行可信度檢測,通過交叉比對,對真實性進行標(biāo)注,根據(jù)驗證結(jié)果進行從0%到100% 的“打分”。
“Tracer”的功能亮點是:能夠?qū)崟r監(jiān)測社交媒體上的新聞;用算法去問記者平時可能會問的問題,倒推新聞的真實性;通過算法和機器學(xué)習(xí)挑選出哪些是新聞,哪些是廣告、謠言或一般性對話,并摘出要點,同時把相同類別的新聞相疊,組成數(shù)據(jù);給記者和編輯提供可靠的素材和資源。
王海明曾用“Tracer”見證謠言“成真”:當(dāng)時,傳出某公司要上市的消息,點擊量從800多逐漸增長,隨后有大V或其它媒體轉(zhuǎn)載,當(dāng)被網(wǎng)站轉(zhuǎn)載后,謠言變成了新聞,但又在 24小時后被澄清。他說:“我見證了整個過程,因為我收到第一新聞源特別早,整個假消息傳播鏈條是一開始局限在小范圍內(nèi),隨著新聞網(wǎng)站的轉(zhuǎn)發(fā)和大V轉(zhuǎn)發(fā)而爆發(fā)的?!?nbsp;
聊天新聞機器人
目前在媒體界,較為主流的做法是將AI機器人作為新聞推送的工具,使其搭載社交媒體的互動屬性。比如,每天自動推送新聞消息;用戶根據(jù)給出的選項自主選擇感興趣的新聞;還可以發(fā)送關(guān)鍵詞獲取相關(guān)新聞。
CNN推出了“個性分發(fā)”。 聊天機器人向用戶推送頭條新聞,在推送下方有三個選項:Read Story、 Get summary、Ask CNN,用戶可以閱讀故事內(nèi)容、了解故事梗概、向聊天機器人提問。
在推送新聞的基礎(chǔ)上,一些媒體開發(fā)出了更加具有記者屬性的AI產(chǎn)品:輔助報道、收集線索資料、向用戶提問,收集對新聞事件的態(tài)度。
BuzzFeed開發(fā)的“Buzzbot”,旨在讓“每個人的口袋里都有一個記者,每個人都可以向“Buzzbot”講述正在發(fā)生的事情?!碑?dāng)用戶打開對話框,“Buzzbot”會進行提問,比如,向用戶提出有關(guān)民主黨大會和選舉的問題,根據(jù)用戶的回答,將用戶的選舉態(tài)度記錄下來,以此幫助記者和編輯分析選民的政治傾向和意見,完成采訪及回收任務(wù)。
這款A(yù)I產(chǎn)品增加了用戶的參與感,讓每個人成為擁有第一手資料的前線記者。作為記者和編輯的資料和素材庫,Buzzbot更像是“后援軍”。
除此之外,還有更加專注垂直信息領(lǐng)域的產(chǎn)品,比如《衛(wèi)報》在Facebook上推出的美食類聊天機器人“Sous-Chef”,當(dāng)用戶與它聊天時,主廚會介紹并推薦菜譜。
這是美國媒體Quartz于2016年初率先推出的聊天新聞軟件界面
秒出稿的寫稿機器人
2016年,《華盛頓郵報》開發(fā)的新聞撰寫機器人“Heliograf ”正式上線。
11月,這款機器人報道了共和黨人史蒂夫·金擊敗民主黨人金·薇芙的新聞:“共和黨人依然控制著眾議院,只是失去了少數(shù)席位,依然占據(jù)著絕對優(yōu)勢。在許多共和黨領(lǐng)導(dǎo)人擔(dān)心兩位數(shù)的損失之后,他們的命運出現(xiàn)了驚人的逆轉(zhuǎn)?!边@款機器人不僅完成了“基本工作”,還預(yù)測了選舉趨勢,被認為具備了該報記者的習(xí)作風(fēng)格。
《華盛頓郵報》的記者和編輯們制作了敘事模板,其中包括各種潛在結(jié)果的關(guān)鍵詞句,比如,“共和黨人對眾議院的控制權(quán)”,“民主黨重新控制了眾議院”。之后,將“Heliograf”與結(jié)構(gòu)性數(shù)據(jù)源聯(lián)系起來。當(dāng)大選到來時,它與數(shù)據(jù)交換網(wǎng)站VoteSmart.org相連,“Heliograf”進行數(shù)據(jù)識別,與模板中的詞句匹配、整合,保證在各平臺上發(fā)布不同版本的報道。
2016年11月份,“Heliograf”創(chuàng)造了500多篇文章,點擊量超過50萬。當(dāng)月,《華盛頓郵報》的總點擊量為11億次。
國內(nèi)媒體緊跟AI潮,主打 “快速、模板化”的新聞寫手
2017年8月初,九寨溝縣發(fā)生地震后,中國地震臺網(wǎng)機器人僅用25秒就編寫出一篇新聞稿。稿件共540字,包括速報參數(shù)、介紹震中地形等內(nèi)容。該機器人結(jié)合了數(shù)字技術(shù)和智能寫稿編程系統(tǒng):實時監(jiān)控信息源;信息抽取;采用機器學(xué)習(xí)算法,以模板和抽取知識庫中信息的方式撰寫新聞。
更早在2015年9月,騰訊財經(jīng)用機器人“Dreamwriter”發(fā)布了一篇關(guān)于8月份CPI的稿件,引用統(tǒng)計局的數(shù)據(jù)、并加入專家及分析師的分析和預(yù)測。之后,“Dreamwriter”被騰訊財經(jīng)廣泛應(yīng)用。據(jù)團隊人員介紹:“‘Dreamwriter’會根據(jù)算法在第一時間自動生成稿件,瞬時輸出分析和研判,一分鐘內(nèi)將重要資訊和解讀送達用戶?!?/p>
今年4月的數(shù)據(jù)顯示,“DreamWriter”在財經(jīng)+科技應(yīng)用的發(fā)稿量超過2000篇/天。
今日頭條的頭條實驗室研發(fā)除了一款名為“Xiaomingbot”的機器人。其寫作模板結(jié)合了最新的自然語言處理、機器學(xué)習(xí)和視覺圖像處理的技術(shù),通過語法合成與排序?qū)W習(xí)生成新聞消息。
有關(guān)2016年,里約奧運會的數(shù)據(jù)顯示,“Xiaomingbot”每天的發(fā)稿量達到30篇以上。“奧運會乒乓球女子單打銅牌賽在里約會議中心-3號館展開,世界排名第50的朝鮮選手金宋依對陣世界排名第8的日本選手福原愛,雙方你來我往展開了激烈的較量。最后,耗時49分鐘,金宋依以4:1拿下比賽。雙方各局比分為: 11:7、11:7、11:5、12:14、11:5?!边@是由“Xiaomingbot”所撰寫的短訊。16天中,“Xiaomingbot”共完成超過450篇新聞稿,閱讀量超過百萬。
目前,AI機器人還不具備創(chuàng)造優(yōu)質(zhì)內(nèi)容的能力,但距離這個目標(biāo)還有多遠?美聯(lián)社已經(jīng)在利用深度學(xué)習(xí)來自動生成有數(shù)據(jù)支撐的文章,其帶來的好處是使媒體將資源轉(zhuǎn)移到具有更高價值的新聞選題上。
《華盛頓郵報》數(shù)字產(chǎn)品開發(fā)副總裁、首席信息官賽利?!て绽ㄊ苍鴱娬{(diào):“‘Heliograf’并不是為了淘汰記者,而是讓新聞編輯室的效率更高?!爆F(xiàn)階段,媒體行業(yè)者對AI的期待是提高效率,將記者從基礎(chǔ)工作中解放出來,讓他們完成更復(fù)雜的選題,讓人來講述只有人能講述的故事。
