不得不感嘆,現(xiàn)在 AI 工具的發(fā)展真的是日新月異。比如昨天介紹的那款數(shù)字人工具,再比如今天要介紹的 AI 語音工具。
其實(shí)關(guān)于兒童繪本這個話題,我前段時間有陸續(xù)寫過兩篇文章談及到。當(dāng)時主要也是看到別人在油管上玩得風(fēng)生水起,然后順便花了點(diǎn)時間挖掘了些相關(guān)信息。
當(dāng)時,我覺得性價比比較高的方案便是使用這樣的繪本 AI 生成平臺,直接購買相應(yīng)的付費(fèi)會員,快速去做相應(yīng)的繪本成品。
但最近玩了會本地開源的 kokoroTTS 模型,我發(fā)現(xiàn)這玩意拿來做兒童語音繪本真的再適合不過了。
因?yàn)檫@款開源的語音模型,對本地電腦的配置要求真的比較低。比如我使用的 Mac Air M3 電腦,用來跑這個模型真的沒有一點(diǎn)問題。且我看相應(yīng)社區(qū)的一些分享,M1 芯片的設(shè)備都能跑得起來。
語音部分用這種零成本的方案解決了,剩下就需要使用相應(yīng)的 AI 模型去設(shè)計故事情節(jié)了,我覺得這塊做得比較好的算數(shù) Claude 了。
其實(shí)做法也不難,先投喂一些繪本名家的成本給 AI 模型學(xué)習(xí),讓其掌握相應(yīng)的繪本框架與故事情節(jié)發(fā)展脈絡(luò)。然后再在此基礎(chǔ)上,設(shè)計出自己的角色形象與相應(yīng)的故事脈絡(luò)。
至于有哪些兒童繪本名家,以及有哪些比較有名的作用,這些基礎(chǔ)信息我們直接用搜索引擎檢索一下(或者用 AI 搜索)便可以了。
基本經(jīng)過上面兩個步驟,故事文本與相應(yīng)的語音素材便做出來了。剩下我們要解決的,便是相應(yīng)的視頻生成(或者幻燈片),與視頻的分發(fā)傳播。
首先傳播這塊內(nèi)容,我覺得前期盡可能依附共有平臺的流量,盡可能低成本去做會好一點(diǎn)。比如那幾個主流的社媒視頻平臺,完全可以作為我們的首選。
其次是圖片的生成,這塊的 AI 工具也已經(jīng)很變態(tài)了。比如英偉達(dá)開源的文字生成圖片模型 SANA,已經(jīng)將這塊的成本降得非常低了,我看網(wǎng)上的消息是一美金能生成近 600 張,基本屬于是零成本了。
至于剩下的圖片幻燈片的生成,現(xiàn)在也有非常多的工具可以幫我們做這塊內(nèi)容。實(shí)在不濟(jì)的話,使用代碼寫一個便好了,沒有什么難度。
如此,兒童繪本制作過程中涉及到的大環(huán)節(jié)便都解決了。剩下要做的就是執(zhí)行,并在執(zhí)行的過程中優(yōu)化相應(yīng)的流程細(xì)節(jié)。
且可以的話,最好還是將這個流程沉淀下來,形成穩(wěn)定的 SOP 執(zhí)行流程,這樣也便于后續(xù)的規(guī)模擴(kuò)大與批量化生產(chǎn)。
文章為作者獨(dú)立觀點(diǎn),不代表DLZ123立場。如有侵權(quán),請聯(lián)系我們。( 版權(quán)為作者所有,如需轉(zhuǎn)載,請聯(lián)系作者 )

網(wǎng)站運(yùn)營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨(dú)立站交流群。
群里有不少運(yùn)營大神,不時會分享一些運(yùn)營技巧,更有一些資源收藏愛好者不時分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。
現(xiàn)在可以掃碼進(jìn)群,備注【加群】。 ( 群完全免費(fèi),不廣告不賣課!)