一言以蔽之:AI生成器對自媒體網站的影響是很深遠的。
網路上有許多網站,講述著同樣的內容,Google會給予這些網站評分,來決定網站的排名順序。Google評分的標準有很多,像是熊貓演算法會打擊都是內容農場的網站、蜂鳥演算法會打擊刻意填充關鍵字的網站、鴿子演算法會依照用戶的地理位置來給予附近的網站……等等,但其中最重要的二個為backlink和content。
- backlink:如果你的網站被維基百科或CNN這種權威網站連結了,就獲得了這些大網站的背書,因而在Google搜尋的排序就會大幅度向前。Google最原始的演算法PageRank,就是在計算來自外部的連結的分數。不過,後來許多網站會用黑帽行為(作弊手法),最簡單的做法就是建立許多免費的小網站,然後建立海量的反向連結給我要prompt的主網站,如此一來,這個主網站的page rank分數便會瞬間被提高。Google也發現了這種,於是就改了程式,企鵝演算法就是用來抓作弊link的。
- content:目前Google主推演算法是所謂的「內容為王」,新的演算法叫BERT(Bidirectional Encoder Representations from Transformers),是一種自然語言處理的技術。簡單地說,Google用的不是傳統的關鍵字比對,而是利用BERT來分析自然語言、瞭解上下全文,這樣子更能匹配用戶搜尋背後的意圖。
靠Google Adsense廣告賺錢的網站為了吸引用戶流量,必然要配合Google演算法,這種行為叫做SEO(Search Engine Optimization、搜尋引擎優化),當然就要很重視內容,通常文章要有一定的長度後,才開始會被Google所重視,這也是為什麼Google推薦的前幾名文章多半會超過一千字。
自從AI生成文本的ChatGPT破天而出,它寫長篇文章的能力是非常強大的,當然就有不少寫手利用AI快速產製文字內容。更何況ChatGPT還是BERT的難兄難弟,同樣都是自然語言處理模型(也同樣是transformer模型),Google BERT就很容易看懂ChatGPT所寫的文章。當網路上都充斥著ChatGPT寫的文章以後,我們可以想像這些自媒體網站將開始沒有價值,而迎來一波倒閉潮,從「內容為王」變成「內容為亡」。
那自媒體經營者要如何突破這個僵局呢?
- 圖文並茂:早年教學網站都是網頁版,後面都搬到YouTube去了,就是因為YouTube可以把整個過程都錄下來,Step-by-Step的引導式教學讓使用者更容易理解。不過我個人覺得YouTube實在是太冗長了(就算開二倍速還是很慢),所以一些有教學畫面的網頁版網站,還是我的最愛。AI除了不能生成這些畫面截圖以外,也不能生成flow chart(至少現在還不能),所以把一堆流程的字畫成流程圖,也可以幫助使用者理解。
- 全新事務:AI會整合過去既有的知識,有時候也會有很多不錯的新產出,然而全新的東西(尤其是網站上沒有的)它就生不出來了。以目前ChatGPT為例子,它收集的資料截止至2021年9月,所以2022年後的資訊,它就完全不知道(雖然已經開始有些API會幫ChatGPT去搜尋)。因此即時新聞或是對全新事務的評論,也是AI生成器還做不到的。
- 在地相關:網路上的資料大部分是介紹大地區,且以英文為主,因此AI瀏覽過的大數據就是這些,所以在鄉土地方的詳細資訊就是AI所未知的。例如在這篇文章中,ChatGPT就說新竹特產是牛肉麵、油雞、米糕(而不是正確的米粉、貢丸),這顯然是AI自己虛構編出來的文字。因此用本地語言來撰寫地區相關的資訊,也可以提供AI生成器所不能提供的正確資料。
- 心情抒發:雖然AI也會寫抒情文,但多半是一些形容詞剪剪貼貼。相較於機器,人類可以從生活中的平凡取材,描述自身經歷聽聞、抒發個人主觀感受。以照片勾勒出畫面,以文字刻劃出細節,營造出活潑的故事。