99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁職業(yè)發(fā)展在線學(xué)習(xí):用大數(shù)據(jù)改英語作文
在線學(xué)習(xí):用大數(shù)據(jù)改英語作文
2015-06-03
收藏

在線學(xué)習(xí):用大數(shù)據(jù)改英語作文


5月31日下午,由百度新聞、36氪、新浪創(chuàng)業(yè)聯(lián)合舉辦的“奇點(diǎn)大學(xué)中國區(qū)學(xué)員選拔大賽”10強(qiáng)選手,在北京恒通國際創(chuàng)新園內(nèi)進(jìn)行了中國區(qū)總決賽。從數(shù)百個(gè)參賽者中脫穎而出的10位創(chuàng)業(yè)者,展示了各自團(tuán)隊(duì)所處領(lǐng)域的前沿科技。

以下為批改網(wǎng)張躍在“奇點(diǎn)大學(xué)中國區(qū)學(xué)員選拔大賽”決賽現(xiàn)場的展示:

張躍:大家好,我叫張躍,來自批改網(wǎng),我們知道全球有超過20億人在學(xué)習(xí)英語,他們需要英語老師,批改網(wǎng)是他們的大數(shù)據(jù)英語老師,用機(jī)器來批改有重要的特征,客觀化,實(shí)時(shí)化和個(gè)性化,最重要的特征是快,我們來看一下演示。

這是我們的首頁,我們可以任意粘貼這篇文章,在傳統(tǒng)的上面老師需要一到兩分的時(shí)間,我們看看批改網(wǎng)上可以一秒重出現(xiàn)結(jié)果,這個(gè)上面有四個(gè)維度,實(shí)際上背后有192個(gè)維度,也就是說邏輯上您可以認(rèn)為每篇作文有192個(gè)裁判進(jìn)行打分,我們給學(xué)生分?jǐn)?shù),更重要的是告訴學(xué)生如何提高。我們每句話給出了按據(jù)點(diǎn)評。我們看這句話,像這個(gè)單詞在本句中很少使用,建議修改,我們告訴了這個(gè)地方不對,可能您要問,什么是對的,我們繼續(xù)往下看,這是英美用戶的常用動(dòng)詞,這里延伸出了兩個(gè)模型,第一錯(cuò)誤在哪里,另外是解決錯(cuò)誤的數(shù)據(jù)在哪里,借助這個(gè)學(xué)生可以進(jìn)行自我交互的過程。我們看此時(shí)此刻我們的正在使用的狀況,這是用戶的實(shí)時(shí)日質(zhì),現(xiàn)在有哪些用戶正在使用,第一欄是學(xué)生的名字,第二欄是學(xué)校的名字,另外是數(shù)字,意味著多少次,就是一遍一遍重復(fù)我剛剛給大家演示的動(dòng)作,這一切都沒有老師的介入,都是學(xué)生自行發(fā)生的,我們看的話,在座可能會(huì)有家長,你會(huì)發(fā)現(xiàn)為什么孩子喜歡玩游戲而不是喜歡做作業(yè),因?yàn)橛螒蚴顷J關(guān)的,有挑戰(zhàn)性,我們在這里分?jǐn)?shù)對學(xué)生而言就是游戲的味道,就是不停的突破分?jǐn)?shù),給更高的刺激。

在互聯(lián)網(wǎng)上大家都知道一個(gè)試錯(cuò)的原則,就是快速試錯(cuò),小步迭代,也是這樣一個(gè)原則。大家看到這個(gè)數(shù)據(jù)我們以前低估了學(xué)生的學(xué)習(xí)熱情,為什么以前學(xué)生不學(xué),是因?yàn)槿鄙倭耸侄?,如果給了這樣的機(jī)會(huì)的話,學(xué)生很愿意。你看這里邊有一個(gè)該一個(gè)上千次了,這是真實(shí)的數(shù)據(jù),這里邊學(xué)生所有的行為都記下來了,這產(chǎn)生了一個(gè)學(xué)生學(xué)習(xí)的大叔據(jù),有了這個(gè)數(shù)據(jù)以后做對了什么,做錯(cuò)了什么,該學(xué)什么,都會(huì)進(jìn)行相應(yīng)的推薦。

這是剛才所看到的演示,我們可以看到學(xué)生的感覺是什么,對于學(xué)生而言就是提交批改,我們剛才看到打的分?jǐn)?shù),你可能要問這個(gè)分?jǐn)?shù)準(zhǔn)不準(zhǔn),就是分?jǐn)?shù)的人工擬合度,我們的精度是92.03%,和南京大學(xué)的測試,和美國一個(gè)相比是92%的打分,這個(gè)市場是藍(lán)海市場,包括學(xué)校和機(jī)構(gòu)等用戶,加起來年消費(fèi)是超過百億的市場。當(dāng)然日本和韓國也有類似的需求和機(jī)會(huì)。

這個(gè)市場上我們的商業(yè)模式分為三個(gè)。第一個(gè)是工具,就是說我們批改服務(wù)多少錢一次,另外是用戶的增值開發(fā),另外是數(shù)據(jù),這里邊數(shù)據(jù)是核心的價(jià)值,匯報(bào)一個(gè)數(shù)據(jù)截止到2015年5月21號,累計(jì)批改的作文已經(jīng)超過了一億篇。注冊用戶,自從2011年6月28號上線以來,批改用戶接近900萬,預(yù)計(jì)到年底今年會(huì)達(dá)到1200萬,我們的速度不是快的,而且推廣方式是是地推為主。在高校市場的市場占有率超過了90%,可能會(huì)問為什么?或者是憑什么,做了什么東西能夠做到讓更多的用戶選擇了我們。確實(shí)也有一些我們自己有很獨(dú)到的地方,比如說如何用語料庫識別中式英文,注意,我把東西躲起來了。這是學(xué)中文的老外說的一句話,第一感覺是別扭。英美用戶看到這句感覺和我們上一句很相似。

這是中式的英文,很多的報(bào)紙上的文章老美一看就是中國人寫的,因?yàn)槌涑庵罅康倪@樣的中式英文。我們看這個(gè)圖,這是這個(gè)單詞前面的分布圖,紅色是中國學(xué)生的用法,藍(lán)色圖是美國人的用法,我們可以看到有一些是不地道的用法,為什么?因?yàn)槊绹烁静挥谩N覀兝蠋煻?,更關(guān)心的是某一個(gè)錯(cuò)誤是哪些同學(xué)在犯。還有這個(gè)例子,我們想知道中國哪些學(xué)生犯了這個(gè)錯(cuò)誤。

我們可以很清晰的看到在中國大概二十多萬,廣東省一萬四千多名,福建省是一萬三千多名,可以追蹤到哪一個(gè)學(xué)校,哪一個(gè)班,哪一個(gè)學(xué)生,哪一個(gè)作文里邊犯了這樣的錯(cuò)誤,對我們教學(xué)是很大的支撐作用。比如說北京市教委對這樣的數(shù)據(jù)很有興趣,今年年初北京市教委和我們聯(lián)合舉辦的北京市初中英語作文大賽,這是懷柔三中舉辦的活動(dòng),這是給獲獎(jiǎng)的同學(xué)發(fā)的獎(jiǎng)狀。

但是比賽的學(xué)生提供的不僅僅是獎(jiǎng)狀,還有大數(shù)據(jù)的診斷單。大家看到這個(gè)診斷單很熟悉,醫(yī)院的診斷單就是這樣的。想象一下去醫(yī)院看病的經(jīng)歷,查各種的參數(shù),目的是拿到你的各種數(shù)據(jù)。所以說在醫(yī)院里邊基本上現(xiàn)在已經(jīng)做到了是什么就知道如何治療,原則是診斷即治療,至少80%的時(shí)間花在如何獲取參數(shù)上,還有一個(gè)理念是軍事的理念,就是發(fā)現(xiàn)即摧毀,對學(xué)習(xí)而言這兩個(gè)理念同樣的重要。尤其是英語這個(gè)學(xué)科。我們看看我們學(xué)習(xí)英語,又叫二語習(xí)得,有一個(gè)很重要的U型理論,核心理論是有一些錯(cuò)誤不可避免去犯的,我舉這個(gè)單詞的例子,剛剛講的時(shí)候一定是知道的,但是一段時(shí)間以后錯(cuò)誤的寫成這個(gè)單詞,然后老師再告訴他,然后慢慢的回來,這是真正的了解。如理解這個(gè)現(xiàn)象呢?

在座的如果是家長可以提醒孩子這一點(diǎn),以后當(dāng)您發(fā)現(xiàn)您的孩子在犯錯(cuò)的時(shí)候,您應(yīng)該高興才對,為什么?犯錯(cuò)意味著正在成長。但是這條線告訴,他犯錯(cuò)的時(shí)候,必須有老師通知,否則的話無法完成U型反轉(zhuǎn),有家長會(huì)問,我們家孩子更聰明,更聰明不意味著不犯錯(cuò),可能會(huì)出現(xiàn)別人孩子五次,你們家孩子是三次,但是是三還是二,你知道不知道,如果有精準(zhǔn)的數(shù)據(jù)可以告訴你,你的孩子兩次就夠了,多了一次就是浪費(fèi)。

這是衡水一中的學(xué)生高考之后曬了所做過的試卷兩米多高,現(xiàn)實(shí)生活中是通過題海的方式野蠻的完成了這個(gè)過程,讓自己錯(cuò)錯(cuò)錯(cuò),對了為止,實(shí)際上這個(gè)東西是客觀存在的,這個(gè)同學(xué)最終考上了清華大學(xué),幸運(yùn)的是清華大學(xué)正在使用批改網(wǎng),包括北大、復(fù)旦等都在使用,除了浙江大學(xué)都在使用,當(dāng)然也包括其他的學(xué)生,像清華這樣的學(xué)校把批改網(wǎng)融入到了教學(xué)體系。

下一步我們做到10億人,如何去做,我們中國的中小學(xué)有1.8億人,我們近期在6個(gè)省市的一百三十多學(xué)校,這是當(dāng)?shù)刈詈玫膶W(xué)校,中小學(xué)完全使用批改網(wǎng),我們和黑龍江大學(xué)聯(lián)合開發(fā)俄羅斯版本,和印度也是在合作,在中國發(fā)生的故事復(fù)制到日本去。

我創(chuàng)辦批改網(wǎng)之前在微軟,全德來自百度,負(fù)責(zé)抓取,這兩位是來自金山,我們成立了英語寫作聯(lián)盟,全國最好的兩所大學(xué)都在里邊,目的是把中國所有的大學(xué)聯(lián)合起來,共建寫作大數(shù)據(jù),今年清華出題,今天為止接近3000所學(xué)校,108萬學(xué)生提交作文,我們發(fā)布的英語寫作大數(shù)據(jù)藍(lán)皮書,每年都會(huì)發(fā)布這樣的藍(lán)皮書,為中國的英語教學(xué)提供數(shù)據(jù)支撐,讓學(xué)校知道我們在全國的水平,讓學(xué)生知道自己的水平。

進(jìn)一步提高大數(shù)據(jù)價(jià)值,在領(lǐng)導(dǎo)的關(guān)懷下,成立了北京市語言智能協(xié)同研究院,我被任命為執(zhí)行院長,這里邊有李德毅院士是我們的首席專家,我們也受到了媒體的持續(xù)關(guān)注和報(bào)道,科技日報(bào)報(bào)道我們當(dāng)英語遇到大數(shù)據(jù),這個(gè)主要報(bào)道了我們這個(gè)游戲因素,如何在娛樂中學(xué)習(xí),在學(xué)習(xí)中娛樂,人民日報(bào)報(bào)告批改網(wǎng),改變語言教學(xué)。在大數(shù)據(jù)時(shí)代重新定義英語學(xué)習(xí)的方式,下一步該學(xué)什么,該看什么,讓數(shù)據(jù)告訴你,每一個(gè)人下次所做的作業(yè)是不一樣的。教育部網(wǎng)站也推出了題目叫做智能技術(shù)幫助你自動(dòng)改作業(yè),批改網(wǎng)讓英語學(xué)習(xí)更簡單,謝謝大家。

主持人:非常精彩的演講,關(guān)鍵是抓住了我們所有人的痛點(diǎn),學(xué)習(xí)英語,每個(gè)中國人的夢想。我們進(jìn)入三分鐘的助陣嘉賓時(shí)間,我們這位助陣嘉賓已經(jīng)來到了現(xiàn)場,大家非常熟悉的熱烈掌聲有請批改網(wǎng)的助陣嘉賓,CSDN和《程序員》創(chuàng)始人蔣濤老師,有請。請發(fā)表您的助陣演講,注意三分鐘的時(shí)間。

蔣濤:大家好,我是CSDN創(chuàng)始人,也是批改網(wǎng)的天使投資人,我是在上一輪泡沫破裂的時(shí)候,投的張躍,因?yàn)樗?dāng)時(shí)做了一個(gè)產(chǎn)品叫聚庫,就是把這些互聯(lián)網(wǎng)上的所有跟英文相關(guān)的寫作的資料聚合起來,我覺得對我這個(gè)土鱉特別有幫助,我在國外寫英文郵件的時(shí)候不知道怎么樣表達(dá),這樣的話通過例句去表達(dá),我覺得這個(gè)產(chǎn)品很有價(jià)值,就投資了。當(dāng)時(shí)泡沫了,沒有人接下一輪,所以我覺得張躍非常有韌勁,堅(jiān)持做下去,找到一條什么路呢?to B,面向企業(yè),而且做的是最難的面向?qū)W校。

我當(dāng)時(shí)說這個(gè)生意可能做不通,應(yīng)該做to C的生意,但是沒有資金了,這是非常不容易,做出了學(xué)生和老師都用的產(chǎn)品,老師說用了批改網(wǎng)了以后,改作文不煩了。也有學(xué)生改的一千多次,這是真正用大數(shù)據(jù),技術(shù)的手段幫助我們更好的改變的教育的現(xiàn)狀,這么多年學(xué)英語,為什么那么困難呢?跟我們的教育資源有關(guān)系,跟我們的教育手段也有關(guān)系,所以批改網(wǎng)做的一件非常了不起的事情,把老師和學(xué)生都真正的聯(lián)合起來,另外基于大數(shù)據(jù)已經(jīng)批改了一億篇作業(yè),有了這樣的數(shù)據(jù)的基礎(chǔ),對于我們進(jìn)一步改善整個(gè)的算法和幫助這些想學(xué)英語的同學(xué)們和朋友們提高英語都有巨大的價(jià)值。

我想它的價(jià)值像教育領(lǐng)域的大眾點(diǎn)評,那個(gè)時(shí)候大眾點(diǎn)評做起來很苦,但是后來移動(dòng)互聯(lián)網(wǎng)來了,大眾點(diǎn)評有了巨大的發(fā)展,教育一開始做也很苦,但是現(xiàn)在累積了數(shù)據(jù)和老師和學(xué)生,我想他的價(jià)值在下一步會(huì)有非常大的空間,我也強(qiáng)烈推薦他去硅谷的奇點(diǎn)大學(xué),把我們這項(xiàng)技術(shù)和國際的技術(shù)結(jié)合起來,美國也有很多的英文表達(dá)也有問題,因?yàn)槭潜就?,也有很多的移民,另外全球有超過20億的人在學(xué)習(xí)英語,可不可以讓這項(xiàng)技術(shù)讓全世界人學(xué)英文呢。另外反過來也幫助全世界人學(xué)中文,他們學(xué)中文也有自己的痛苦,所以我想把這個(gè)技術(shù)結(jié)合起來,對全世界學(xué)習(xí)第二語言的人都有幫助,這是我對他的幫助,謝謝,希望大家給他投一票。

主持人:非常感謝蔣濤老師的精彩的推薦,感謝,請后臺休息。下面你的助陣嘉賓和自己的演講都很精彩,我們看最后一個(gè)環(huán)節(jié),五分鐘的問答時(shí)間。

評委:我覺得學(xué)會(huì)特別優(yōu)雅和得體的書面表達(dá),至少是我個(gè)人一直在追求做得越來越好的事情,無論是中文還是英文,這一點(diǎn)特別謝謝,如果有東西可以幫助我們做得越來越好是非常好的一件事。不過我有兩個(gè)好奇的點(diǎn),第一個(gè)點(diǎn)是整個(gè)的語料庫一開始在建立的時(shí)候過程中,是怎么樣去做的,一開始最早期的語料是怎么樣積累的,一開始的語料很少的話,沒法去冷啟動(dòng),非常的難。

第二個(gè)問題就是說想國際化我覺得特別好。但是現(xiàn)在的這個(gè)階段做國際化除了那些基本的合作資源之外,在推廣上有什么樣的資源可以讓這件事做成。

張躍:我們預(yù)料庫主要分兩個(gè),一個(gè)是白預(yù)料庫,什么是對的,就是英美用戶寫的人,另外是黑語料庫,我們認(rèn)為存在問題的。您注意到我們合伙人有一個(gè)人來自百度,負(fù)責(zé)采集,紐約日報(bào),花兒報(bào)日報(bào),我們每天采集,不關(guān)心說什么,我們關(guān)心他怎么說,我們借此跟蹤英語的發(fā)展,我們每一篇中國學(xué)生的作文就是黑預(yù)料庫,這是我們最大的價(jià)值,這是第一個(gè)問題。

另外您說國際化這一塊,我們推動(dòng)國際化的過程中,我們什么樣的資源出現(xiàn)了,就去做了,比如說為什么和因特爾合作印度市場,原因很簡單,因特爾負(fù)責(zé)全球教育的是印度人,他對我們有興趣,他是印度人,他認(rèn)為印度也是需要這個(gè),所以先做印度市場。為什么做日本市場,日本想進(jìn)中國市場,找合作伙伴,找到我們,他發(fā)現(xiàn)進(jìn)入中國不如把我們進(jìn)入日本做得更快更好。所以這樣的資源出現(xiàn)以后,不是我們等到想做哪一個(gè),而是等合適的資源出現(xiàn)以后再去做,印度和日本是我們下一個(gè)目標(biāo)。

評委:我有一個(gè)問題,從剛才的問題往下問,他問你的是進(jìn)入國際市場的策略,我想問的是語言學(xué)習(xí)和寫作是需要有很多的功底的問題,你抓了很多的語料庫,你想學(xué)日語、俄羅斯語等市場里邊有沒有難度需要去解決的。

張躍:不是有難度,是非常難。為什么?我說兩個(gè)原因,第一個(gè)拿中國人來說,中文不像英文那么規(guī)范,這是第一點(diǎn)。第二點(diǎn),我們答英語作文,我們團(tuán)隊(duì)認(rèn)為機(jī)器欣賞不了一篇文章的美,為什么有人用這個(gè)軟件呢,因?yàn)槲覀儗τ⑽臅鴮憶]有到那一步,考四六級或者是高考,考英文會(huì)有模板的,比如說吸煙有害健康,就是說考作文不用你用英文表達(dá)你思想利益,而是準(zhǔn)確的表達(dá)。而即便是達(dá)到這個(gè)要求是他的優(yōu)勢,我去測量他的某一個(gè)標(biāo)準(zhǔn),我認(rèn)為計(jì)算機(jī)很難理解文章的美,所以你剛才的問題來講,語種這個(gè)問題非常難,中文也會(huì)非常難。

評委:你是怎么解決這個(gè)問題的?

張躍:其他的問題可能我鋪解決,我認(rèn)為英文市場足夠大。

主持人:單點(diǎn)突破就好了。謝謝。

評委:有一個(gè)問題請教一下,我們現(xiàn)在已經(jīng)通過批改積累了很大的語料庫,包括對語意識別的能力,這些能力很語料庫,除了批改,還有沒有計(jì)劃用在其他的領(lǐng)域中的應(yīng)用。

張躍:是這樣的,我覺得首先這個(gè)領(lǐng)域足夠大,我們在大數(shù)據(jù)的時(shí)代標(biāo)準(zhǔn)學(xué)習(xí)是這樣的先寫作業(yè),告訴你哪一步缺什么,每個(gè)人的成功路徑都是不一樣的,都是用數(shù)據(jù)來告訴你的,所以我覺得這個(gè)領(lǐng)域足夠大,每一個(gè)學(xué)員是以數(shù)據(jù)為中心進(jìn)行個(gè)性化的學(xué)習(xí),每個(gè)人下一步都不一樣。

主持人:時(shí)間到,進(jìn)行任何有關(guān)語言學(xué)習(xí)的領(lǐng)域都會(huì)應(yīng)用到你的技術(shù),這是非常精彩的演講。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }