不知道大家有沒有去看鹿晗和舒淇主演的科幻片《上海堡壘》,整體講述的是外星人入侵地球的故事,上海成為最后的根據(jù)地,而黃浦江里的上海大炮成為翻盤的唯一希望,當(dāng)然了,還有鹿晗和舒淇的愛情故事。
不過上映以來,這部電影就被各種罵,導(dǎo)演、編劇都接連出來道歉。
盡管豆瓣評分目前只剩下3.2分,但是評價中還是有人試圖客觀的分析電影失敗的原因,其中一個就是故事太過爛俗。
然而隨著自然語言處理(Natural Language Processing,簡稱NLP)的不斷發(fā)展,是否在電影拍攝前就根據(jù)電影的腳本摘要預(yù)測這部電影會不會受到大眾喜愛呢?
來自韓國的幾名研究人員就嘗試了這個方法。
四萬多部電影數(shù)據(jù),訓(xùn)練可預(yù)測電影好壞的AI
研究人員試圖訓(xùn)練出一個機(jī)器學(xué)習(xí)模型,可以通過電影摘要,分辨哪些哪些電影會成功或者失敗。如果人們可以進(jìn)一步完善這個模型,有朝一日,制片人可以在電影制作前就能預(yù)測出這部電影在票房上是會大賣或者撲街。
為了訓(xùn)練這個模型,研究員使用了來自世界各地,總共42306個電影情節(jié)作為數(shù)據(jù)集,大部分來自CMU電影摘要語料庫。
數(shù)據(jù)集
模型先將摘要劃分成句子,并用情感分析來分析每個句子。模型將認(rèn)為是“積極”的句子,譬如“Thor喜歡他的錘子”,打分更接近1。模型將認(rèn)為是“消極”的句子,譬如“Thor打架了”,打分更接近-1。
最后綜合兩個輸出進(jìn)行分類,從而得出一個電影是否會成功。
模型分類架構(gòu)
情節(jié)越起伏,觀眾越買賬
通常,成功的電影,比如1951年的《愛麗絲夢游仙境》,在Rotten Tomatoes電影評價網(wǎng)上獲得了80%的分?jǐn)?shù),情緒波動頻繁;不成功的電影,比如2009年的《控制限制》情緒波動較小。研究員說,電影開頭或結(jié)尾是否皆大歡喜并不重要。重要的是情緒變化頻繁。
電影中的“波動性”衡量標(biāo)準(zhǔn)是將每個摘要的情緒打分壓縮成一個分?jǐn)?shù),來反映情緒的變化。研究人員測試了三種不同獲得最終分?jǐn)?shù)的方法。這三個方法都可以準(zhǔn)確地預(yù)測一部電影是否會受歡迎。
上面兩張圖中,第一張里面的電影《愛麗絲夢游仙境(Alice in Wonderland)》的開頭和結(jié)尾都很積極,電影《靴子(Das Boot)》和《一個男人(A Man for All Seasons)》每一季的開頭和結(jié)尾都是消極的。電影《葛底斯堡(Gettysburg)》展示了命運的逆轉(zhuǎn),開始時是消極的,結(jié)束時是積極的。人們普遍注意到,這些成功的電影有頻繁的情緒波動。
而第二張則是不成功的電影的情感分析,它表現(xiàn)出較少的情感波動。電影《控制的極限(The Limits of Control)》和《迷失的刀鋒戰(zhàn)士(Lost Bladesman)》都有消極的開頭和結(jié)尾。電影《大鍋(Tai-Pan)》以消極的開頭,以積極的結(jié)尾。電影《藍(lán)舌和尚(Bluetproof Monk)》的開頭和結(jié)尾都是正面的,但是在故事發(fā)展的過程中,大多數(shù)人的情緒得分都是負(fù)面的。因此,這表明情緒變化的頻率可能預(yù)示著電影的成功。然而,情緒的兩極對預(yù)測一部電影的成功影響甚微。
現(xiàn)在只能分好壞,希望將來能預(yù)測票房
研究人員在8月1日意大利佛羅倫薩舉辦的2019Storytelling Workshop上指出:盡管這些方法在猜測電影是否成功上表現(xiàn)并不出色,但是它們依舊比隨機(jī)預(yù)測更加準(zhǔn)確。
研究人員說,在未來,他們的方法會進(jìn)行改進(jìn),希望能夠預(yù)測一部電影的票房值,并幫助制片人決定這部電影是否值得投資。
在這個模型的應(yīng)用方面,研究人員補(bǔ)充說,這個系統(tǒng)公平的評價機(jī)制對于不知名的作家來說是好事,不會因為名氣小而被埋沒。
同時也能潛在的幫助公眾,爛片被扼殺在搖籃里,觀眾們也就不必浪費時間看完像《大白鯊:復(fù)仇》這樣票房和口碑雙撲街的爛片了。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。