英語寫作的“苦”,AI能幫你嘗?

原標(biāo)題: 英語寫作的“苦”,AI能幫你嘗?

文|李北辰

這個世界上有多少人在學(xué)習(xí)英文?

根據(jù)德國知名語言學(xué)家烏爾里?!ぐ⒚桑║lrich Ammon)的估計,答案是15億,是學(xué)習(xí)法語,漢語,西班牙語,德語,意大利語和日語人數(shù)總和的10倍左右。

具體到中國,拋去全球互聯(lián)網(wǎng)上80%的信息,60%的廣播節(jié)目,75%的電視節(jié)目都是英文的宏觀背景不談,一代代學(xué)生被英文“折磨”的最直接原因是考試,在升學(xué)的推動下,英語已經(jīng)是數(shù)代中國學(xué)生的必修課。

而眾所周知,在“聽說讀寫”這四大英文核心要素中,最考驗(yàn)英文綜合能力的“寫”,無疑“折磨”學(xué)生最多。無論是中小學(xué)英語考試,四六級,還是國際標(biāo)準(zhǔn)化測試,那些不易覺察的語法問題,不易調(diào)配的“高級”詞匯,都是橫亙在學(xué)生與一篇“漂亮”作文面前的絆腳石。

想要踢開這些絆腳石,除了日趨高昂的私教錢,很多學(xué)生都缺少一個貼身的作文老師。而在另一邊,對于在校任教的英文老師而言,考慮到現(xiàn)在一個學(xué)生的課業(yè)負(fù)擔(dān),需要逐句批改的作文量也已堪稱卷帙浩繁,這往往會讓負(fù)責(zé)任的老師苦不堪言。

事實(shí)上,這也是為什么去年年底,當(dāng)?shù)弥④泚喼扪芯吭和瞥鑫④洝皭蹖懽鳌本W(wǎng)頁版時,許多學(xué)生,家長,和老師都倍感欣喜的原因,“愛寫作”在語法批改和評估反饋等方面的技術(shù)幫襯,委實(shí)令他們感到輕松許多。

而就在幾天前,“愛寫作”手機(jī)端也已正式上線,更便捷的批改與寫作,讓人能更好地用碎片化時間完成學(xué)習(xí),且與網(wǎng)頁端一樣,從語法,用詞,到文章結(jié)構(gòu);從中小學(xué),四六級,到雅思托福,它能根據(jù)不同年級和類型的作文標(biāo)準(zhǔn),有針對性地匹配反饋建議,幫助不同學(xué)習(xí)者提升英文寫作水平。

1

事實(shí)上,基于微軟亞洲研究院在自然語言處理和OCR(光學(xué)字符識別)等領(lǐng)域的研究成果,加之微軟小英多年以來的技術(shù)積淀,針對英文寫作的不同痛點(diǎn),“愛寫作”逐漸探索出了不同亮點(diǎn)。

依我之見,其中應(yīng)用最廣泛的是語法檢查功能。

你或許知道,人類語言學(xué)一個最經(jīng)典的命題就是:語言限定了人類思維的邊界。就像哲學(xué)家維特根斯坦所言,由于每個人都是在語言的邊界內(nèi)寫作與思辨,很難覺察到語言工具的局限。譬如終身只用漢語寫作的人通常不會意識到,漢語中沒有主賓格和單復(fù)數(shù)等邏輯信息,所以斯坦福大學(xué)教授雷拉·波洛狄特斯基(Lera Boroditsky)才說:“每種語言都包含著一種獨(dú)特的世界觀,反映了使用者數(shù)千年來的思想,傾向和認(rèn)知方式?!?/p>

這種“思想,傾向和認(rèn)知方式”,許多時候會讓語法成為英文寫作的最大障礙。例如時態(tài)等語法錯誤,倘若只是日常聊天,有點(diǎn)錯沒啥大不了,但當(dāng)文字落于紙上,還是不出錯為好。

讓學(xué)生避免語法錯誤,也是“愛寫作”首先想要解決的?!皭蹖懽鳌痹诳焖偻瓿扇恼Z法檢查的同時,會將提交作文中的語法問題用紅色下劃線標(biāo)記出來,學(xué)生點(diǎn)擊紅線,就可獲得有針對性的語法講解,且還能看到修改后作為參考的正確表達(dá)。

在英文寫作中,比“正確”更難的,是“高級”。

這就要說到“愛寫作”的另一項重要功能:詞語替換。

有個著名的段子。家長問老師:“我家孩子4歲,英語詞匯量大概只有1500個左右,是不是不太夠?”。老師回答:“在美國肯定夠了,在海淀區(qū)肯定不夠?!?/p>

這個段子當(dāng)然充滿了中國式家長的焦慮,但你得承認(rèn),從英文的角度,掌握更多單詞確實(shí)能豐富描述同一事物的維度,在日常練習(xí)中,老師也確實(shí)經(jīng)常會問:“還有沒有更高級的詞可以用在這里?”

因?yàn)樵S多時候,僅僅是替換一個單詞,就會生出一種賞心悅目的高級感(我相信看過《綠皮書》的人會對此深有體會),只可惜有些中國學(xué)生背了不少單詞,卻不能在最該用的時候信手拈來,這也極大影響了作文的美感。

針對于此,微軟“愛寫作”的詞語替換功能,可以根據(jù)上下文篩選出多個高級詞匯供你選擇使用,譬如讓你不再只會用“good”和“nice”這種簡單詞匯,而是能看到諸如“impressive”和“admirable”這種更高級復(fù)雜的詞匯進(jìn)行替換。

嗯,作為一個專業(yè)的中文寫作者,我當(dāng)然知道,有些時候“直抒胸臆”是最好的表達(dá),但也有些時候,“豈曰無衣,與子同袍”會因更具美感而更具力量。

最后,再來簡單了解下“愛寫作”的分類作文打分和手寫圖片識別功能。

打分功能不僅能對所有文章進(jìn)行一般性評分,還能測試同一篇作文在不同考試類型中的得分狀況,因?yàn)椴煌目荚囋谠~匯語法,文章結(jié)構(gòu)和切題程度等方面有著不同的考量標(biāo)準(zhǔn),所以“愛寫作”在給出分?jǐn)?shù)的同時,還可有針對性地評價一篇作文在不同方面的表現(xiàn),并給出反饋建議。

而手寫圖片識別功能,能讓學(xué)生只需用手機(jī)給作文拍照上傳,就可將其轉(zhuǎn)換成可用智能終端編輯的文字,語法檢查,作文打分,詞語替換等批改功能也可全部實(shí)現(xiàn)。你可以想見,除了方便學(xué)生,老師也可借助此功能,輕松識別學(xué)生們各不相同的手寫字體,讓作文批改工作事半功倍。

為了測試上述功能,我找了一篇手寫英文段落,下面就是手寫稿和系統(tǒng)自動識別的對比,不難發(fā)現(xiàn),除了僅有的一個單詞錯誤(your 識別成 year),以及需要把標(biāo)題歸到標(biāo)題欄,識別結(jié)果非常完美,你可以直接編輯修改。

而完成編輯后,點(diǎn)擊“批改”,系統(tǒng)會讓你選擇級別,我選了初中,批改結(jié)果如下。

可以發(fā)現(xiàn),我選的這篇文章“十分優(yōu)秀”只有一個語法錯誤,用紅線標(biāo)注,建議改為is——但為了錦上添花,系統(tǒng)給出了詞語替換的建議(藍(lán)線標(biāo)注詞語,這點(diǎn)真的很好用)。另外,點(diǎn)擊“詳細(xì)報告”,系統(tǒng)還會從文章流暢度和文章內(nèi)容兩方面提供建議。

最后值得一提的是,上述功能不但會持續(xù)得到優(yōu)化,且“愛寫作”同一賬號手機(jī)端和網(wǎng)頁端數(shù)據(jù)是打通的,用戶可以在PC端練習(xí)寫作,在手機(jī)端更方便地查看檢索,完成英文寫作的全場景覆蓋。

2

不難發(fā)現(xiàn),對于學(xué)習(xí)者而言,“愛寫作”讓英文寫作訓(xùn)練變得更簡單,而在這種簡單背后,蘊(yùn)含著微軟自身AI技術(shù)的深厚積淀。

很多人知道,在AI輔助英語學(xué)習(xí)領(lǐng)域,微軟亞洲研究院有著多年的經(jīng)驗(yàn):2009年就發(fā)布英庫詞典(必應(yīng)詞典的前身);2016年發(fā)布英語學(xué)習(xí)助手微軟小英;2018年將“作文打分”功能嵌入微軟小英。

而“愛寫作”也經(jīng)歷了很長的研究階段。如今,研究員在不斷對自然語言處理等AI領(lǐng)域的算法模型進(jìn)行迭代后,終于讓其成為提升英語寫作能力的利器。

以語法檢查功能為例,其采用了微軟亞洲研究院全新的學(xué)習(xí)和推斷機(jī)制Fluency Boost Learning and Inference(流暢度提升學(xué)習(xí)與推斷),幫助用戶“找茬”。通過 Fluency Boost Learning(流暢度提升學(xué)習(xí))生成的大量糾錯數(shù)據(jù),結(jié)合 seq2seq 預(yù)訓(xùn)練技術(shù),語法糾錯模型在 CoNLL-2014 和 JFLEG 兩個權(quán)威語法糾錯數(shù)據(jù)集上都率先超越了人類參考水平,并且持續(xù)保持著業(yè)界領(lǐng)先的技術(shù)水準(zhǔn)。

再比如,在詞語替換功能中,研發(fā)人員提出了基于預(yù)訓(xùn)練語言模型的詞替換方法,并結(jié)合微軟原創(chuàng)的預(yù)訓(xùn)練語言模型——UniLM作為詞替換的解決方案。該方法通過半遮蓋(partial masking)等策略讓預(yù)訓(xùn)練語言模型能夠同時考慮原目標(biāo)詞詞義以及上下文語境,從而選出合適的替換詞。

我知道,普通讀者很難理解這些復(fù)雜的技術(shù)名詞——你只需要知道,正是這些“復(fù)雜”,醞釀出用戶練習(xí)英文寫作時的簡單。

另外你要知道的是,微軟亞洲研究院是一個計算機(jī)技術(shù)的研究機(jī)構(gòu),而非一個“教育機(jī)構(gòu)”,這也意味著,他們打造“愛寫作”的目的,不是向市場推出一個“教育產(chǎn)品”去賺錢(順便一提,微軟小英自2016年推出至今都是免費(fèi)的),而是通過與不同領(lǐng)域機(jī)構(gòu)(尤其教育領(lǐng)域)的充分合作,更好地理解教育行業(yè)和用戶痛點(diǎn),探尋AI技術(shù)在教育行業(yè)的廣闊可能。

核心就是兩個字:賦能?!皭蹖懽鳌笔窃谝约夹g(shù)為長板,以場景為核心,賦能合作伙伴,讓其掌握最新的技術(shù)工具,在AI時代發(fā)現(xiàn)新機(jī)遇,最終雙方再共同賦能用戶,解決中國英語寫作學(xué)習(xí)者在移動和AI時代的需求。

事實(shí)上,“愛寫作”的這種角色,很容易令人想到微軟賦予自身的使命:通過提供平臺和生產(chǎn)力工具,賦能地球上的每個人和每家組織,幫助他們?nèi)〉酶喑删汀?/p>

結(jié)語

我一直說,判斷一款產(chǎn)品優(yōu)良的方法從來不拘一格,但有種方法深得我心,即它是否具備“若我年輕時就有它,該有多好”的屬性,這種產(chǎn)品通常出現(xiàn)在教育領(lǐng)域。

是啊,包括我在內(nèi),無數(shù)中國學(xué)生經(jīng)歷過學(xué)習(xí)英語的煎熬,每個人學(xué)習(xí)英文寫作的過程,也都像是一部“血淚史”,因?yàn)槭聦?shí)就像海明威說的那樣:“寫作沒什么秘訣,你要做的只是在打字機(jī)前流血?!?/p>

對于中國的英文寫作學(xué)習(xí)者來說,這句話仍然是對的,提高寫作能力沒有捷徑,沒人能繞開平日枯燥的大量練習(xí)——但如今,新技術(shù)的加持,至少可以在你“流血”時,少一些痛苦,多一些回報。

“若我年輕時就有它,該有多好”。

作者:李北辰,獨(dú)立撰稿人,國內(nèi)數(shù)十家媒體專欄作家,曾供職《南都周刊》《華夏時報》《財經(jīng)》等媒體

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-04-21
英語寫作的“苦”,AI能幫你嘗?
事實(shí)上,這也是為什么去年年底,當(dāng)?shù)弥④泚喼扪芯吭和瞥鑫④洝皭蹖懽鳌本W(wǎng)頁版時,許多學(xué)生,家長,和老師都倍感欣喜的原因,“愛寫作”在語法批改和評估反饋等方面的技術(shù)幫襯,委實(shí)令他們感到輕松許多。

長按掃碼 閱讀全文