高中生真的懂電影票房嗎?
如果一個(gè)行業(yè)能被一個(gè)中學(xué)生就帶偏了節(jié)奏,那這個(gè)行業(yè)本身也就極不健康。
(資料圖片)
最近,浙江三名高中生在國際核心期刊發(fā)文的消息被媒體廣泛報(bào)道。雖然此前就曾經(jīng)有多個(gè)類似的案例,但是這篇論文題目還是吸引了我們的興趣——《基于人機(jī)協(xié)同特征處理的電影票房預(yù)測算法》。
在分析這篇論文之前,這個(gè)新聞事件本身已經(jīng)受到了不少網(wǎng)友的質(zhì)疑。
首先,這三位高中生并不是獨(dú)自撰文,而是作為這篇論文的第3、4、5作者。這篇正文只有12頁的論文,字?jǐn)?shù)和研究量也并不多,第一作者是浙江大學(xué)的一名博士,有順?biāo)浦蹘饲橹印?/p>
其次,論文本身影響力也確實(shí)有限。根據(jù)其他網(wǎng)友探究,這個(gè)期刊有一名主編和六名編委,全部來自中東地區(qū)。其中主編和三名編委來自科威特大學(xué),QS排名1000+。剩下三名編委來自埃及、卡塔爾和沙特,所屬學(xué)校排名最高在200+。這篇來自四區(qū)的論文影響因子僅有0.4。
最后,我們也發(fā)揮一下我們的專業(yè),分析一下這篇研究電影票房預(yù)測的論文,究竟有多少有價(jià)值的內(nèi)容。
論文表達(dá)了什么?
首先我們來看論文的摘要和論文結(jié)論,內(nèi)容通過有道翻譯進(jìn)行譯制,略有修改。
摘要:提高票房預(yù)測的準(zhǔn)確性,有利于刺激電影市場的創(chuàng)作、市場投資、基礎(chǔ)設(shè)施建設(shè)和公共資源的合理配置,促進(jìn)社會(huì)福利和文化繁榮。由于現(xiàn)有的票房收入預(yù)測算法沒有考慮電影產(chǎn)業(yè)結(jié)構(gòu),預(yù)測精度不理想。
本文首先構(gòu)建了兩階段人機(jī)協(xié)同特征處理框架。第一階段以票房數(shù)據(jù)為基礎(chǔ),利用回歸決策樹算法對所有票房特征進(jìn)行初步處理,自動(dòng)刪除不重要的特征;第二階段將特征處理與建立的人工神經(jīng)網(wǎng)絡(luò)(ANN)相結(jié)合。在這一階段,機(jī)器處理的特征被手動(dòng)分類,多個(gè)不兼容的特征集被劃分。設(shè)計(jì)了不相容集網(wǎng)絡(luò)修剪算法,對神經(jīng)網(wǎng)絡(luò)進(jìn)行了修剪。我們用從四個(gè)平臺(tái)上抓取的7098部電影構(gòu)建了數(shù)據(jù)集。數(shù)值實(shí)驗(yàn)結(jié)果表明,兩階段算法的平均絕對誤差(Mean Absolute Error, MAE)明顯優(yōu)于基線模型,可以有效地直接降低不兼容特征之間編碼引起的噪聲,提高人工神經(jīng)網(wǎng)絡(luò)的預(yù)測精度,加快人工神經(jīng)網(wǎng)絡(luò)的正向推理速度,減少計(jì)算資源的消耗。
結(jié)論:借鑒“人在回路”的人機(jī)協(xié)作設(shè)計(jì)思想,提出了“特征篩選-神經(jīng)網(wǎng)絡(luò)構(gòu)建-人工修剪”的預(yù)測算法。它結(jié)合了傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)理論,首次應(yīng)用于電影票房預(yù)測領(lǐng)域。該算法在基于數(shù)據(jù)的傳統(tǒng)機(jī)器學(xué)習(xí)特征處理的決策樹算法基礎(chǔ)上,引入人類先驗(yàn)知識(shí),對構(gòu)建的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)行人工修剪,然后對修剪后的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到預(yù)測參數(shù)模型。實(shí)驗(yàn)結(jié)果表明,與業(yè)界常用的線性回歸、決策樹、支持向量機(jī)等傳統(tǒng)算法相比,本文算法在預(yù)測精度上有明顯提高。這證明了本文方法的有效性。即人在回路是通過結(jié)合人和機(jī)器的優(yōu)點(diǎn)來實(shí)現(xiàn)的。
作為第一篇將人機(jī)協(xié)作的思想引入電影票房預(yù)測算法設(shè)計(jì)過程的文章,本文也揭示了基于人機(jī)協(xié)作的AI算法設(shè)計(jì)在各個(gè)領(lǐng)域有著廣闊的應(yīng)用前景。后續(xù)工作將探索非結(jié)構(gòu)化數(shù)據(jù)集下的人在環(huán)預(yù)測方法,并嘗試在電影票房收益管理中進(jìn)行實(shí)踐。否則,我們將繼續(xù)探索在其他應(yīng)用背景下預(yù)測和分類任務(wù)的特定問題結(jié)構(gòu),分析人類所發(fā)揮的獨(dú)特作用,并相應(yīng)地設(shè)計(jì)更高精度的人機(jī)協(xié)作機(jī)器學(xué)習(xí)算法。
首先,這篇論文的研究方向是根據(jù)北美電影市場的測算,因?yàn)樗衅狈恳约霸u分?jǐn)?shù)據(jù)比較全面,機(jī)器也相對方便抓取。
簡單來說,這篇論文就是設(shè)計(jì)了一個(gè)機(jī)器算法,這個(gè)算法是用來預(yù)測電影票房的。這個(gè)算法獨(dú)特之處,就在于該算法是在機(jī)器學(xué)習(xí)中引用了“人在回路”,提高了預(yù)測的精準(zhǔn)度。就是運(yùn)用海量數(shù)據(jù)進(jìn)行計(jì)算和判斷,人工進(jìn)行干預(yù)。機(jī)器就在此循環(huán)中不斷學(xué)習(xí),變得更聰明更準(zhǔn)確。
另外,論文當(dāng)中預(yù)測票房的公式,主要是七個(gè)參數(shù)。分別是1.影片導(dǎo)演指數(shù);2.影片演員指數(shù);3.影片出品/制片公司指數(shù);4.影片發(fā)行公司指數(shù);5.影片預(yù)告片熱度指數(shù);6.影片話題熱度指數(shù);7.影片檔期指數(shù)。
通過這一點(diǎn)看,影片的票房預(yù)測研究理論也算基本合理,沒有太過于業(yè)余。
根據(jù)情報(bào)君了解,所謂AI、機(jī)器學(xué)習(xí)、人機(jī)交互等大數(shù)據(jù)測算技術(shù),無論是在國內(nèi)還是國外,都早就已經(jīng)運(yùn)用在了電影市場票房預(yù)測這一行當(dāng)中,本文并不是首創(chuàng)。不過也因?yàn)轭A(yù)測準(zhǔn)確率較差,目前仍然沒有對外開放,人機(jī)合作仍然是預(yù)測票房的最主要方式。不過無論是好萊塢每年100億美元+的市場,還是中國四五百億人民幣的市場,在AI、ML(機(jī)器學(xué)習(xí))等業(yè)務(wù)范圍內(nèi),實(shí)在是屬于很小很小的一塊蛋糕。而對于中國市場來說,機(jī)器的準(zhǔn)確性就更低了。
為什么在中國預(yù)測票房更難?
相比已經(jīng)成熟的北美電影市場,中國電影市場的預(yù)測才是最難的課題。
雖然在好萊塢預(yù)測票房準(zhǔn)確率一直不算太高,但是至少95%以上的電影,提前一周進(jìn)行預(yù)測的話,誤差范圍能夠控制在50%以內(nèi)。這也是基于北美以及海外發(fā)達(dá)的市場機(jī)制,但是國內(nèi)并不是這樣。
電影票房預(yù)測是電影行業(yè)較為關(guān)注的一個(gè)研究方向,尤其是能否盡早給出準(zhǔn)確的票房預(yù)測。如果能盡早的對票房做出預(yù)測,影片的制作方和發(fā)行方可以根據(jù)票房預(yù)測的數(shù)據(jù),對影片的制作和發(fā)行做出適當(dāng)?shù)恼{(diào)整,更合理的使用預(yù)算,以獲得更高的利潤。預(yù)測的越早,越有實(shí)用的價(jià)值,但是目前無論是中國的票房預(yù)測,都基本集中在定檔之后的宣發(fā)期。
可以說,目前中國票房預(yù)測的意義,也許重要的不是最終預(yù)測出來的那個(gè)簡單的數(shù)值,而是預(yù)測過程中,對影片多元影響因素的分析從而調(diào)整對應(yīng)的宣發(fā)策略以達(dá)到收益最大化。
不過市場畸形,加上觀眾盲目,也很容易導(dǎo)致爆款頻出、炮灰扎堆的現(xiàn)象,不利于中等體量影片的穩(wěn)定發(fā)揮,市場上,除了回報(bào)率2-3倍的超級(jí)爆款,就是賠的連宣發(fā)費(fèi)用都收不回的撲街影片,缺少了中間影片的填充。而影片檔期選擇、宣發(fā)策略的一招失誤,就可能導(dǎo)致整個(gè)影片的票房成幾倍的誤差,這也導(dǎo)致了對國產(chǎn)片的票房預(yù)測充滿了極大的不確定性。
很多的票房預(yù)測人士表示,只要看過片,就已經(jīng)能對這部片的內(nèi)地表現(xiàn)做一個(gè)八九不離十的預(yù)估,但是現(xiàn)如今,主流觀眾的口碑愈發(fā)難以捉摸,業(yè)內(nèi)、影評人有時(shí)候甚至無法想到一部平庸的電影在主流觀眾面前會(huì)那么受歡迎,抑或是本來一部良心制作的影片會(huì)因?yàn)轶w裁限制而無人問津。
大數(shù)據(jù)沒有原罪,有的只是用大數(shù)據(jù)造假和輕信假數(shù)據(jù)的人。作為票房預(yù)測者,只有不斷的學(xué)習(xí),面對數(shù)據(jù)造假見招拆招,更進(jìn)一步理解市場,不斷的修改預(yù)測,不怕打臉。不要因?yàn)槠狈款A(yù)測失靈,就否定大數(shù)據(jù)對于電影業(yè)的價(jià)值。
至少在未來5年內(nèi),在中國進(jìn)行票房預(yù)測還沒有機(jī)器能夠做到。
關(guān)鍵詞: 機(jī)器學(xué)習(xí) 神經(jīng)網(wǎng)絡(luò) 研究方向
責(zé)任編輯:hnmd004
- 高中生真的懂電影票房嗎?2022-12-06
- 聚焦:金融持續(xù)發(fā)力支持實(shí)體經(jīng)濟(jì)2022-12-06
- 北京新增備案7家社區(qū)養(yǎng)老服務(wù)驛站2022-12-06
- 這項(xiàng)課題研究獲最高院年度司改專項(xiàng)調(diào)研優(yōu)秀2022-12-06
- 12月6日新聞聯(lián)播速覽15條2022-12-06
- 多地影院恢復(fù)營業(yè),全國單日票房一度超40002022-12-06
- 當(dāng)前速看:北京環(huán)球度假區(qū):12月7日起進(jìn)入2022-12-06
- 今日精選:北京:不斷改進(jìn)方法細(xì)化流程,精2022-12-06
- 環(huán)球熱資訊!深圳部分學(xué)校通知:在校核酸改2022-12-06
- 廣東發(fā)布加快開展基礎(chǔ)設(shè)施公募REITs試點(diǎn)實(shí)2022-12-06
- 今日要聞!北京:延長住房公積金緩繳期限、2022-12-06
- 天天熱門:風(fēng)范股份擬9.6億元收購晶櫻光電602022-12-06
- 兩部門:建設(shè)一批高品質(zhì)綠色健康建筑和低碳2022-12-06
- 世界要聞:北京:進(jìn)一步降低企業(yè)經(jīng)營成本,2022-12-06
- 北京:對小微企業(yè)貸款實(shí)施延期還本付息政策2022-12-06
- 百事通!北京:支持開發(fā)貸款、信托貸款等存2022-12-06
- 全球快資訊丨北京:延長住房公積金緩繳期限2022-12-06
- 懷柔鎮(zhèn)積極推進(jìn)環(huán)境整治提升2022-12-06
- 消息!關(guān)乎咱爸媽,養(yǎng)老有TA,機(jī)構(gòu)隨心查2022-12-06
- 熱點(diǎn)聚焦:三部門:新增14個(gè)地區(qū)開展二手車2022-12-06
- 天天快資訊丨晶圓代工廠聯(lián)電11月營收環(huán)比下2022-12-06
- 播報(bào):保利置業(yè)前11月合同銷售額450億元2022-12-06
- 熱推薦:港交所:北向資金八年累計(jì)成交額達(dá)2022-12-06
- 世界消息!風(fēng)電領(lǐng)域需要有大動(dòng)作!歐盟下決2022-12-06
- 【天天播資訊】法國海上風(fēng)電加速,啟動(dòng)2.5G2022-12-06
- 今日聚焦!長沙縣第一人民醫(yī)院暫停社會(huì)面核2022-12-06
- 焦點(diǎn)消息!一批在杭事業(yè)單位公開招聘!部分2022-12-06
- 河南新鄉(xiāng)擬調(diào)整商品房項(xiàng)目配建保障房方式并2022-12-06
- 中國海外發(fā)展:前11月累計(jì)合約物業(yè)銷售額約2022-12-06
- 每日播報(bào)!福田汽車:11月新能源汽車銷量2382022-12-06