2017-03-16 10:09:44分類:行業資訊4482
隨著技術的發展,越來越多的新聞媒體希望通過先進的技術提高發稿數量,提升新聞服務質量。"機器新聞寫作"是人工智能技術在新聞傳播領域一個現象級的發展。早些年,福布斯網站、美聯社、彭博社、洛杉磯時報等媒體已在體育、財經、天氣等領域實現了"機器人寫新聞"。今年以來,國內的騰訊公司、新華社相繼推出了研發多時的新聞寫作機器人,并直接應用于新聞寫作實踐,引發熱議。
信息科技時代,高科技武裝的機器智能正越來越多地解放著人的體力和腦力。事實上,我們正生活在一個越來越由人工智能所定義的世界里--智能搜索引擎告訴我們哪些資訊更重要;算法根據個人習慣和興趣,推算出我們應該看什么電影,聽什么歌,買什么商品;警方利用犯罪大數據決定在哪里強化治安部署……就新聞領域而言,技術對新聞行業的入侵早已不是什么新鮮事,即使是新聞寫作,這項長期依賴于記者采訪的累活兒,在人工智能科技的高速推進下,也正變得越來越"新潮"。
前不久,新華社正式推出新聞機器人"快筆小新"參與寫稿項目。這臺智能化的機器人可以快速完成體育賽事、中英文稿件和財經信息稿件的自動撰寫。實際上這并不是國內第一個"寫稿"機器人。早在9月10日,騰訊財經一則標題為《8月CPI同比上漲2.0%創12個月新高》的消息就由一款自動新聞寫作軟件Dreamwriter"操刀"完成,這款寫作軟件能根據算法進行及時分析和研判,在一分鐘內將重要資訊和對信息的解讀送達用戶。在科技發達的歐美國家,相關技術更進一步。福布斯網站早在兩年前就已經啟用NarrativeScience的程序自動生成財經新聞。在去年7月,美聯社也開始使用自動化技術報道公司業績,截至2014年底,其智能寫作系統已完成了4400篇財報新聞,效率是人類記者的15倍。
那么,機器人寫稿子到底是如何運行的呢?
對于相對"格式化"的新聞資訊,機器人消除了傳統媒體的弊端,可以做到瞬間反應、迅捷生成,在短時間內處理大量數據,且差錯率較低。他們內容生產過程的核心,是基于云計算和大數據分析的人工智能,依賴于一個或多個采集存儲了大量高質量數據的龐大數據庫,在寫稿時,機器人先從海量數據庫中找出符合新聞主題需要的原始數據信息,然后通過一系列結構化處理、清洗,把數據信息重新排列組合,形成高質量的結構化數據,最后套用設定好的固定新聞模板將文本呈現出來。數據挖掘中間上下前后的連接邏輯也比較簡單,并且數據源比較單一。這方面,在內容相對單調枯燥,報道風格單一,又對數據準確度和速度要求很高的體育賽事播報、證券財經類、領導人公共活動、天氣預報等新聞中,機器人"智能填充輸出"優勢十分明顯。正因此,無論是美聯社與AutomatedInsights(AI)公司合作,使用他們的Wordsmith平臺自動生產財報,還是新華社"快筆小新"應用在中國足球超級聯賽報道,都很大程度上加快了出稿速度,減少了記者工作量。
知識概念模型技術的應用,有助于將記者、編輯、專家話語智慧轉換成計算機可識別數據,從而在信息數據的整合編排過程中,機器人能快速從海量數據中挖掘可用于文本分析的專家智慧數據,從而模仿類似專家的行為(人工智能模仿),自動生成包括原因、結論、推測等深度分析新聞。同時,若添加、串聯不同語言風格的語料庫,在出色的語義分析技術帶動下,機器人新聞生成將匹配更加豐富的自然語言,內容輸出將呈現多樣性、個性化,以適應不同社會階層或年齡段的受眾群體。特別是隨著大數據的發展以及相關用戶行為痕跡的記錄跟蹤,與之匹配的新聞推送早已成熟,隨之而來的"私人訂制"的新聞生產也并非遙不可及。
其實這種憂慮為時尚早,因為當下的機器人新聞生產尚處在"稿子拼湊、語言堆砌"的稚拙摸索階段,即"幼年"期,在未來相當長一段時間內機器智能還遠遠無法替代人的"大腦",尤其是那些需要體現思考價值、人文審美的新聞稿件,依舊依賴于媒體記者們來完成。"機器可以根據格式和語法規則寫一首詩,或者一篇小說,但全世界的數據加起來,也無法讓一個程序理解愛、悲傷或恐懼。"[1]AutomatedInsight的CEORobbieAllen早前就說過:"其實就是讓機器人把數據轉化成故事,真正的難點在于怎么讓它看起來像人寫的,因為只有數據不是好故事。"
事實也是如此,新華社"快筆小新"盡管已能夠采寫多種類型的資訊稿件,但"編輯簽發"依舊是無法忽略的重要環節。即使是美聯社也公開承認,隨著大量財報新聞由機器人撰寫,新聞的質量將會有所下降,針對一些關注度比較高的公司,如Google、蘋果的財報,美聯社直接承諾將繼續由資深記者手工撰寫,以避免帶來風險性。
當下時髦的機器人新聞寫作還有一個致命缺陷,就是其局限于現有數據庫的信息加工。這有兩個方面的影響:
一是平臺數據庫積累的大小、質量、類別等,都將影響機器人新聞生產的內容質量,特別是一旦出現數據缺陷或算法邏輯差異,都可能導致不同的內容輸出結果。更為致命的是,諸如情緒、價值這種東西是很難用數據量化并存儲的,具體新聞故事場景中,機器人新聞生產很難相應加入"情感"元素,為此,他們更多只是"機械地"從數據庫里抽取形容詞。
二是新聞寫作機器人即使能通過對數據庫的深入挖掘與信息組合,創造出很多原創性新聞,但發生于社會現實的素材或者說實地實景的社會信息,依舊難以呈現。這背后實際上道出了一個機器人寫作的現實背景:即機器人能進行新聞寫作并不是本身有多高明,而在于,在這個時代,新聞生產可以不完全依賴于線下采訪。新聞生產和采訪的脫離,是互聯網蓬勃發展對傳統新聞業整體性的顛覆,也是當今時代媒體行業的重大變更。反過來也一樣,現實生活中的題材依然離不開記者的實地采訪,最起碼線下的信息內容需要編輯記者人工輸入到統一的數據庫中,新聞寫作機器人才能進行下一步工作。即使只有這一過程,記者的價值依舊不可替代。
盡管多家媒體推出了新聞機器人,但目前主流輿論依然認為,記者工作是一種復雜的、高級的腦力勞動,人性是機器難以逾越的鴻溝,人類的深刻理解力和創造力是機器難以效仿的。不過,這種看法或許太過保守,科技進步之下機器的進化速度令人驚嘆,未來的機器人必將越來越智能。特別是人工智能、大數據運算、機器學習等新技術不斷取得突破性發展,我們已看到了語音識別、機器翻譯、機器人寫新聞、即時數據展示、個性化推薦等許多媒介變化。當代最有影響的媒介理論家之一DouglasRushkoff在《編程,或者被編程》一書中寫道:隨著計算機和網絡計算能力的不斷提升,"思考本身將不再--至少不再是獨一無二地--成為人類的特權"。瑞典學者的一項研究顯示,大多數讀者無法分辨自動寫作軟件和記者撰寫的某些報道。有軟件公司負責人預測,在5年之內機器人所撰寫的文章就能獲得普利策新聞獎,并稱將來90%新聞稿由機器人撰寫。
顯然,過分夸大和低估智能機器帶給新聞行業乃至人類社會的影響,都是極其不負責任的。那么,如何定位當下聲名鵲起的新聞寫作機器人相對適合呢?機器人"Quakebot"的設計者舒文克提出一種相對中性的觀點,他認為,機器人寫手雖有其技術優勢,但卻無法完全具備人的靈活性和創造力,讓機器人成為記者的幫手,相信它會使工作更有趣。國內不少媒體人士也指出,相對程序化、枯燥的工作交由機器人后,記者們將有更多精力和時間來應付更需要獨特角度和思考的報道。2014年3月26日,《人民日報》刊發署名為"趙鐸"的文章《"機器人記者"忙起來》指出,機器人寫手只是一種輔助形式,它可以節省時間,把記者從一堆基礎數據和信息中解放出來。但機器人撰寫新聞的過程就像一個復雜的填詞游戲,一些具有固定模式的行業性文章更符合它的能力,"如果有一天記者真的被冷冰冰的機器人取代,新聞恐將淪為諸多報道模式的生硬拼盤"。
不管如何爭論,如今,機器人與人工智能已不再停留在暢想階段,它們正成為產業新風口,掀起新一輪技術創新浪潮。如何適應未來的技術變革,顯然也是國內外媒體亟需思考的命題。筆者認為,以下兩點尤其值得各媒體提前做好內功:
1.積極搶占數據浪潮的高地
智能化離不開互聯網數據,隨著新聞傳播業數據庫建設的發展,大數據庫不僅成為新聞媒體向用戶提供新聞信息服務的直接手段之一,也是媒體內容生產走向自動化深入挖掘轉型的重要基礎。特別是隨著互聯網跨界融合的發展,互聯網開放技術賦予各媒介平臺流量信息的共享與豐富,活躍于互聯網媒介的信息用戶正成為新聞寫作素材的間接生產者,每天提供著海量的網絡信息(數據),這些有跡可循的用戶行為痕跡都可能成為未來新聞智能創作的基礎數據。可以說,未來擁有基礎數據的規模,將成為衡量一個媒體實力的重要標志。反過來,采集大量高質量的數據,又有助于通過數據挖掘實現信息篩選與新聞生產的個性化、精準化定位,大大降低用戶獲取有效信息的成本。
2.大力推進業務與技術深度融合
我們正在歷經一場由技術應用推動的媒體轉型,媒體形態和輿論格局正在發生深刻調整,智能化趨勢下,新聞業無論是產品形態,還是新聞生產力,都會經歷新的洗禮,新聞傳播正處于一個重要的歷史分界點。但無論是現在還是未來,行業的信息技術含量會越來越重,其中人工智能交互將是最核心趨勢。目前,類似百度新聞和今日頭條的個性化推薦就是智能交互的初級階段。尤其是新媒體領域,新媒體發展最關鍵在技術層面,新媒體本身就是技術驅動的媒體,比如雅虎、Facebook、微博、微信等,都是一個新的技術運用很快占領市場。因此,媒體轉型必須跟蹤前沿技術,創造自己獨特的技術,打造屬于自己的獨創產品。
"機器人寫作"是知識技術融合的產物,機器稿件生產系統的出現,雖然將給新聞傳播行業帶來深刻而長遠的變化,但萬變不離其宗的是,新聞從來都是一種極富"專業性、創造性"的智力活動。在新聞寫作過程中,記者們創作出更具專業性、思想性的新聞內容,我們才不至于被機器人所代表的科技力量所擊潰。