什麼是生成式 AI?
生成式 AI (Generative AI) 和 辨識式 AI (Discriminative AI) 是兩種不同的機器學習方式。辨識式 AI 擅長於對數據的分析、整理和歸納,其輸出結果通常是可預測的。這種模型多用於語音轉文字,或者文本和圖像分類,例如情感分析、垃圾郵件檢測、物品辨識和人臉分類等場景。
而生成式 AI 經過深度學習後,能夠理解內容數據集中的模式和關係。它會利用所學的模式生成新內容。它擅長創作,而不是分類和預測,主要應用於文本生成、圖像生成,以及當今風頭正盛的視頻生成領域。
提示詞的重要性
在探討生成式 AI 的應用之前,不得不再次提及我們與生成式 AI 互動的媒介 – 提示詞 (Prompt)。
在與大型語言模型交流時,我們需要通過輸入提示詞來獲取結果,返回結果的質量與我們提供的提示詞質量有很大關係。
這也是為什麼很多人對生成式 AI 浅尝辄止的原因之一。在選擇優秀模型的同時,我們同樣應該重視提示詞的質量。
您可以點擊下方的視頻,初步了解優秀的提示詞應該如何撰寫。
生成式 AI 在日常工作中的應用
一、文本生成
ChatGPT、文心一言等產品皆屬於此類。 文本生成,聽起來很簡單,實際上卻是包含了生成式 AI 最常見的使用場景,例如問答、對話、翻譯、摘要、補全等等,而具體到實際工具,又有更多分支。
辅助编程
對於開發者而言,生成式 AI 在輔助程式碼編寫上的應用尤為突出。 例如,GitHub Copilot 可以幫助開發者自動生成程式碼片段,提供程式碼分析和建議,甚至是整個函數的實現。 這種工具能夠極大地提高編程效率,幫助開發者解決編程難題。
撰寫電子郵件
在商務溝通中,自動生成電子郵件回復可以節省大量時間。
生成式 AI 可以根據收到的郵件內容,自動生成禮貌且專業的回復,甚至幫助撰寫營銷郵件,提高溝通效率和客戶滿意度。
優化語言和風格:基於特定場景或收件人,人工智慧能夠調整語言風格和語氣,確保溝通更為有效。
錯誤檢測與修正:自動檢測語法錯誤並提供修正建議,提升郵件的專業度。
個性化內容生成:人工智慧能夠根據收件人的偏好和過往交流記錄,生成個性化的郵件內容,提升溝通效果。
创作文学作品
在文字創作方面,生成式 AI 可以幫助作家構思故事情節、生成角色對話、檢查語法和錯別字問題,作為創作者的輔助工具,提供靈感,使創作過程更加流暢和多樣化。
但在擁有這些優勢的同時,也應注意生成式 AI 在寫文章時,也會有一些缺點:
缺乏原創性 – 人工智能的寫作內容的來源於其被投喂的數據,所以它輸出的內容可能會缺乏原創性,流於俗套。
故事講法有限 – 雖然 AI 可用於生成情節,但它難以理解寫作的方法與技巧,導致其寫出的故事缺乏深度和情感共鳴。
基於文件內容進行對話
大家用過ChatPDF、ChatDOC等工具嗎?隨著OpenAI宣布開放API,一系列專注於特定場景的智慧工具也應運而生。
這些基於語義分析技術的工具致力於幫人“快速理解文章”,只需上傳文件,AI 就能理解文件內容,並和你對話,隨時回答有關內容的各種問題。
只需要上傳文件,AI 就能變身為精讀了文件的大 V,可以解答關於這篇文件的任意問題。目前此功能支持在LightPDF 網頁端與移動端使用,隨後也會同步更新到電腦端。
智能快速閱讀:通過 AI 文件對話,LightPDF 能夠快速抽取文獻中的關鍵信息,並支持多文件/多鏈接/文件和鏈接混合對話,提供摘要和總結,讓用戶能夠迅速了解文獻的核心內容,從而在短時間內實現快速閱讀。
關鍵信息提取:自動識別文獻中的關鍵信息,如重要觀點、實驗結果和結論等。還支持自定義角色,你可以將 AI 設定為審稿人、導師等角色,以便協助您解決更具體的問題。
問題解答:上傳文件後,在對話框提出問題,AI 即會根據上傳的文獻內容智能解答,支持聯網搜索功能,為用戶提供更全面、準確的信息,減少你在閱讀過程中產生的時間成本。
多語言支持:LightPDF 的 AI 文件對話支持多種語言,你可以上傳各種語言的文獻,並讓它按照你要求的語言回答問題,拓寬信息獲取的廣度。
二、圖像生成
近年來,基於生成式 AI 的圖像生成技術也取得了飛速發展。例如 Midjourney、Stable Diffusion、DALL·E 等,它們能夠根據文本描述生成高度逼真的圖像,或者基於現有圖像參考進行風格變換。
而由這些功能演化出的各種圖片 AI 工具也呈現了難以想象的創造力。例如,將簡筆畫轉換為逼真的照片,讓用戶輕松實現藝術創作;幫助設計師快速生成視覺原型,加速產品開發的過程等。
三、音頻生成
音頻生成包括語音合成、音樂創作等。語音合成技術使得生成式 AI 能夠根據文本模擬出自然流暢的聲音,多應用於語音助手、有聲書、配音等場景。
普通的文本朗讀式 AI 已經普及到個人用戶,現在你我都可以利用開源項目進行音源訓練(如 So-VITS-SVC),製作自己的聲音模型。
而筆者認為音頻領域目前的重點是在音樂創作方面,現在 AI 生成的音樂大多僅能夠輔助人創作,為音樂家提供靈感來源。或是應用於背景音樂、音效等簡單的場景。
四、影片生成
隨著 OpenAI 推出了 Sora 模型,生成式 AI 在影片領域也迎來了突破。就現在來看,這項技術還並未對普通人產生影響,如果一定要舉個例子的話,我想說威爾史密斯吃麵條很好笑……👇。
從最基礎的影片剪輯、特效添加,到基於文本描述生成影片內容,再到實時影片風格轉換。生成式 AI 能夠讓影片素材幾何式地增長,也讓創作成本呈幾何式地下降,可以預見這項技術會被大規模運用於電影製作、在線教育、社交媒體內容創作等領域。
我要評論