京東莎士比亞系統(tǒng)2.0正式上線
2022-06-16|10:36|發(fā)布在分類 / 多多開店| 閱讀:194
2022-06-16|10:36|發(fā)布在分類 / 多多開店| 閱讀:194
與1.0相比,2.0系統(tǒng)可生成完整的文案段落。在語言表達上更貼切,描述更為精準與切題,此外表達的方式也更加豐富。京東ai研究院常務副院長、深度學習及語音和語言實驗室主曉冬博士透露,在保證ai能夠實現(xiàn)基礎的文字表達后,京東正在將人類的情感表達以及更為的修辭手法例如比喻、排比、擬人等技巧融入其中。。
在2.0的版本中寫作能力有了大幅提升,且表達豐富性等方面均取得了長足進步,能夠幫助商家實現(xiàn)在服飾、居家、個護化妝等品類上的商品詳情描述工作,大幅提高商家的工作效率。而京東也在不斷加大ai智能寫作的投入,目前已經(jīng)匯聚了京東ai研究院以及京東美國硅谷研究院 。
從單句到段落 文案的一小步 ai的一大步
眾所周知,相較于單句文案寫作,段落文案的生成難度,無論是底層數(shù)據(jù)庫支撐,還是算法難度上都更具挑戰(zhàn)性,不僅要考慮句子與句子之間的起承轉合,還需保證各分句之間圍繞同一主題進行描述,否則生成的文案有可能出現(xiàn)不切題,句與句之間自相矛盾的風險。京東“莎士比亞”2.0系統(tǒng)打破了這一瓶頸,在長文案的寫作上邁出了堅實的一步。當前莎士比亞能夠根據(jù)商家的需要,僅輸入與商品相關的幾個關鍵詞例如“連衣裙”“雪紡”“高跟鞋”三個關鍵詞,生成按鈕,即可生成多個與之相匹配的文案描述。
根據(jù)關鍵詞自動生成產(chǎn)品文案
可以看到“莎士比亞”2.0系統(tǒng)能夠判定用戶輸入的多個關鍵詞之間,何為中心詞、何為搭配詞,避免主次不分、描述混亂的現(xiàn)象。除了關鍵詞,商家還可以輸入商品的京東sku生成文案,且可對生成的文案內(nèi)容做編輯修改,并添加至個人收藏,而機器則會根據(jù)用戶修改情況,判別內(nèi)容優(yōu)劣,下次展示時做出順序調(diào)整。
該項目負責人談到:“即便是一些不太常見的關鍵詞,“莎士比亞”系統(tǒng)也能生成段落,這源于我們系統(tǒng)上建立的龐大文案數(shù)據(jù)庫,能覆蓋商品詳情頁文案中出現(xiàn)的主流描述用語?!?/p>
大規(guī)模集成機器學習技術突破ai“語言障礙”
莎士比亞2.0的品類覆蓋擴展至服飾、居家到美妝個護,在短短的3個月里就完成了迭代,其中離不開京東硅谷研究院前臺產(chǎn)品算法團隊與京東ai研究院的通力協(xié)作,使其在算法優(yōu)化上提供了強大的技術保障。“莎士比亞”系統(tǒng)采用的主要算法,是根據(jù)用戶輸入的主題詞自動擴展主題詞,自動篩選出比較優(yōu)的候選主題詞序列方案和自適應學習方案,利用大量的數(shù)據(jù)訓練seq2seq模型后,經(jīng)過不斷優(yōu)化和迭代得到比較終符合任務要求的模型。對于此次迭代所實現(xiàn)的段落描寫,系統(tǒng)則是基于大規(guī)模集成機器學習技術,結合語義理解、篇章分析、近義詞匹配、情感分析等自然語言處理技術,自動生成切題、通順、有感染力的文案。相對于端對端純粹從數(shù)據(jù)生成文案的方式,該方法的優(yōu)勢就在于融合了數(shù)據(jù)和語言學知識,生成出來的文案可讀,且準確匹配輸入信息。能夠真正達到言之有物、打動讀者的目的。
通過京東ai研究院與京東硅谷研發(fā)團隊分工協(xié)作,既利于單一品類的做深、做精,又利于多品類的齊頭并進,雙方技術交流分享互通有無,避免重復研發(fā)、提升效率。比較終生成的文案結果會由專業(yè)的文案同事進行打分,研發(fā)人員根據(jù)打分情況做出修正,并根據(jù)業(yè)務方的實際需求做出模型調(diào)整。
向寫作進發(fā) 讓閱讀者產(chǎn)生共鳴感
硅谷研究院陳力博士表示,ai寫作剛剛開始,莎士比亞將會向寫作發(fā)力,讓機器寫出的文案讓閱讀者產(chǎn)生共鳴般的體驗。而要實現(xiàn)這一點,京東將會集中在以下三點來發(fā)力。
第一,理解詞語本意并進行擴展。對于京東商品描述的寫作,難點就在于對關鍵詞本身的延展,例如我們輸入裙子,計算機能夠理解裙子的意思同時圍繞它能夠延展出裙子樣式的描寫、材質的描寫、搭配的描寫等等,這是十分困難的,尤其是結合商品本身的功能特色,引申出貼切、抽象的場景與畫面,需要機器具備類似人類大腦神經(jīng)元般的聯(lián)想機能,而這絕非輕而易舉,需對數(shù)以萬計的漢語詞匯建立映射關系,“喂”給機器學習。
第二,文案風格的準確與豐富。文案的寫作風格能夠根據(jù)商品本身的性質去撰寫出恰當?shù)奈陌革L格進行表達,同時京東基于bi(商業(yè)智能)已經(jīng)實現(xiàn)了對用戶推薦商品的豐富多變,如廣告語、發(fā)現(xiàn)好貨文章、商品詳情頁等文案,也能根據(jù)用戶畫像實現(xiàn)智能推送。
第三,押韻美感及平仄韻律的塑造。中國文字博大精深,特別是修辭手法的多元化,漢語寫作中常見的比喻、排比、擬人等修辭手法,一直以來都是人工智能領域的難題。而要做到韻腳的美感和平仄節(jié)奏的變化也是目前人工智能不斷在探索的課題。
“莎士比亞”系統(tǒng)要產(chǎn)出高質量文案,自然繞不開這一研究課題,計劃在3.0階段將加入韻律庫并能夠有平仄的韻律感,上下句銜接時,借助豐富同義詞、近義詞庫的替換引用,就會降低不押韻的概率,使得文案讀起來朗朗上口。
相關閱讀:
京東快車和淘寶直通車有什么區(qū)別
京東快車智能匹配出價怎么操作?
京東眾籌文案怎么寫?把握好這幾點
這個問題還有疑問的話,可以加幕.思.城火星老師免費咨詢,微.信號是為: msc496。
推薦閱讀:
淘寶店鋪是如何通過數(shù)據(jù)分析驅動內(nèi)容運營?
更多資訊請關注幕 思 城。
微信掃碼回復「666」
別默默看了 登錄\ 注冊 一起參與討論!