善用AI 助內容創作者更上一層樓

一項研究發現,生成式人工智能(Generative AI)通過補充元數據 (Metadata)能擴闊網上內容的受眾群,但效果至今仍不及人類
社交媒體不只是通訊媒介,更是建構跨地域社群及拓展市場的工具。去年,美國國會基於國家安全理由通過法案,禁止來自中國的短片分享平台TikTok在美國營運。到今年初,TikTok面臨「不賣就禁」,不少美國用戶湧至另一中國社交媒體平台小紅書以示抗議。
儘管如此,在禁令首次暫緩數月後,TikTok母公司字節跳動預計今年的收入仍有20%增長,至1,860億美元,僅略低於Meta 的1,870億美元預期收入。受益的並非只有社交平台,內容創作者亦能通過贊助獲得收益,若他們擁有大量支持者,更可成為意見領袖「KOL」 賺取相當可觀的收入。
留住用戶的關鍵在於把內容準確地推薦予合適的受眾。社交平台上的影片數以億計,平台會憑演算法分析影片標題,再根據用戶的瀏覽記錄及喜好推薦相應內容。用戶亦可通過搜尋功能找到想看的影片,但這僅佔觀看量的一小部分。
「所以內容創作者應在標題及說明文中加上關鍵字或hashtags(#),這是平台推薦系統用來提高推薦內容切合度的唯一元數據,」香港中文大學(中大)商學院決策、營運與科技學系副教授張任宇表示。「這些元數據就影片提供有條理且精簡的資訊,令平台推薦系統能準確地識別內容重點。」

可惜大多數由用家創作內容(User-generated content,UGC)的平台都缺乏元數據 —欠缺描述性標題或hashtags 。許多平台會因此而利用生成式AI來填補元數據,惟張教授及其團隊在最新的研究《AI生成元數據對用家創作內容平台的價值:來自大型實地實驗的證據》中發現,效果或未如理想。
「用家自行撰寫的標題往往比AI 生成的標題更吸引,但後者仍然有其價值,因為它們能節省撰題的工夫,並為創作者提供靈感,」張教授分析。「雖然AI 的整體表現較遜色,但生成的內容有一定指導作用,尤其是對於那些技術不足的創作者而言。」
AI扭轉局面
在是次項研究中,張教授與新加坡國立大學教授Goh Khim Yong 及其博士生張心怡 、以及研究員孫辰朔,聯同亞洲一個主要短片平台合作進行了一系列的實驗。該平台的每日活躍用戶超過3億,但當中只有60.7%的影片配有標題,這比例與其他用家創作內容平台相近。
研究人員分析了逾200萬名用戶所製作的一千多萬條影片。他們把這些影片分為兩類,一類是實用影片,主要提供資訊和教育內容,例如新聞、評論及教學影片;另一類是享樂影片,包括娛樂、生活品味等內容,例如影片網誌vlog、喜劇短片及旅行影片。在進行實驗前,61.3%的實用影片及57.3%的享樂影片配有標題。
該平台於2023年7月引入生成式AI工具,通過截取影片中的片段,然後根據當中的影像元素及文字來編寫符合內容的元數據。研究人員把創作者隨機分配到兩組:實驗組能獲得AI 生成的標題;而對照組則只能靠人手撰寫標題。
研究發現,AI工具令影片配上標題及Hashtags 的比例分別提升了41.4%及72.4%。而使用AI 生成標題的影片的觀影人數平均增加1.6%,觀看時長則平均增加0.9%。
對於技術較低,或訂閱人數及影片數量低於中位數的創作者,AI生成的標題能幫助他們的收視率及觀看時長分別增加1.6%及1.3%。此外,研究進一步分析了近9,400萬條影片的資料,發現獲AI輔助的實驗組在點讚、分享及訂閱人數方面亦顯著較多。

「AI 生成的元數據可以豐富輸入推薦系統的資訊,從而提高用戶創作內容與受眾的匹配程度,提升整體的個人化體驗,」張教授指。「這些影片的觀眾群更為多元,顯示經過改進的元數據能使系統將內容推送至更廣泛、更多元化的觀眾群。」
人腦思維 vs. 機器智能
上述結果似乎有利無弊,惟更仔細的分析發現,人工智能有時候會帶來反效果。研究發現,實用內容使用AI 生成的標題後,收視率下降3.1%、觀看時長縮短3.0%。而已由創作者自行撰寫標題的影片,若使用AI改寫,觀看量及觀看時長分別下降37.9%和32.6%。
然而,若創作者編輯AI 生成的標題,每10%的修改便會增加9.8%的觀看量及8.2%的觀看時間。當AI生成的標題與修改後版本的相似度下降至20%時,影片的受歡迎程度會比沒有AI生成標題的為高。這意味著內容創作者應該在AI建議的基礎上作出大幅修改,以寫出最具吸引力的標題。
進一步的分析顯示,AI通常只能產生出基本的主題摘要,往往未能提供更明確和引人入勝的具體描述。例如,當AI 生成這樣的一個標題:「享受大自然之美 #優美風景」;內容創作者則可將之提升為「鬱鬱山巒涓涓溪流:感受大自然的寧靜」,以更豐富的辭彙寫出更詳細的描述,令推薦系統能更精準地為影片及用戶作配對。
適用於不同平台
生成式AI創作內容的功能得到不少用家的肯定,但它亦引起了有關原創性及版權方面的憂慮。本項研究就AI如何透過加強元數據來改善推薦系統及內容推送提供了另一個視角。
由於AI生成的元數據對於低技術及製作享樂主題的內容創作者的幫助尤其見效,各大平台在決定擴大AI工具的使用時,應優先考慮這些群體。優先安排新晉內容創作者使用AI功能將能產生最直接明顯的效果。
此外,平台應考慮提供編輯選項,以提升元數據的精確度,而非把AI生成的標題搬字過紙。這種做法不僅能使用戶創作內容的平台受益,亦有利於其他同樣依賴推薦增加使用量的平台(包括電子商務平台)。
「在電子商務平台上,產品通常需要諸如材料、顏色及尺寸等元數據,由於資料量繁多,賣家須要耗費長時間來輸入;使用AI 生成的元數據便有助於簡化這一過程,且有望在推薦準確性及效率方面帶來改善,」張教授說。
隨著大型語言模型以及能融合處理多種模態數據的多模式AI的發展,張教授認為,AI生成的元數據將遠不只是簡單的標題,而是可以包含更豐富、更有條理的描述。未來的AI可自動生成摘要、Hashtags 、情感基調、影片章節註釋,甚至是結合視覺、聲音及文字線索的敘述。
「這些元數據將提供對內容更深層次的語義分析,使推薦系統能夠作出更周密、更切合內容的配對,對於解決冷啟動問題(Cold start problem)以及提高不同內容類別的個人化程度尤其重要。」