久久综合综合久久综合_六月丁香婷婷色狠狠久久_麻豆AV一区二区天美传媒_麻豆产精品一二三产区区_麻豆精品无码国产在线果冻_免费吃奶摸下激烈视频青青网_免费无码又爽又刺激网站_嫩草院一区二区乱码_女人喷液抽搐高潮视频_欧产日产国产精品,亚洲免费视频在线播放,一区二区99精品国产黄色电影,美女精品永久福利在线

直通屏山|福建|時(shí)評(píng)|大學(xué)城|臺(tái)海|娛樂(lè)|體育|國(guó)內(nèi)|國(guó)際|專題|網(wǎng)事|福州|廈門|莆田|泉州|漳州|龍巖|寧德|南平|三明
您所在的位置:: 東南網(wǎng) > 首頁(yè)> 黨政網(wǎng)群> 福建記協(xié) > 正文

面對(duì)海量信息 如何實(shí)現(xiàn)內(nèi)容識(shí)別

2019-08-13 15:54:33??來(lái)源:人民網(wǎng)-傳媒頻道  責(zé)任編輯:肖月青 肖月青  

互聯(lián)網(wǎng)平臺(tái)的出現(xiàn)以及移動(dòng)傳播體系的形成,改變了人類內(nèi)容生產(chǎn)和分發(fā)的方式,。從形態(tài)上,,互聯(lián)網(wǎng)平臺(tái)代替?zhèn)鹘y(tǒng)媒體成為了信息聚合和分發(fā)的樞紐;從傳播關(guān)系看,,社會(huì)成員個(gè)體的參與愿望及信息需求,,形成了當(dāng)代社會(huì)信息交互的雙輪驅(qū)動(dòng)。反映在內(nèi)容生產(chǎn)與分發(fā)過(guò)程中,,現(xiàn)象之一就是互聯(lián)網(wǎng)用戶個(gè)人上傳的各類內(nèi)容成為了網(wǎng)絡(luò)空間里一個(gè)海量的存在,以當(dāng)前發(fā)展迅速的短視頻平臺(tái)為例,,它們每天都有數(shù)以千萬(wàn)條計(jì)的短視頻內(nèi)容上傳,;現(xiàn)象之二是,這樣海量的內(nèi)容只有通過(guò)移動(dòng)終端,,面向用戶個(gè)人的差異化信息需求,,通過(guò)推送式的精準(zhǔn)分發(fā),才能使人們所生產(chǎn)的信息“各得其所”,、“各盡其用”,,以充分發(fā)揮不同內(nèi)容的效能。

這一切的前提是內(nèi)容本身是真實(shí)的,,健康的,。而面對(duì)每天上傳到互聯(lián)網(wǎng)平臺(tái)上數(shù)以十萬(wàn)篇計(jì)的文章,、千萬(wàn)條計(jì)的短視頻、十億張計(jì)的照片這樣級(jí)別的海量信息,,想要鑒別它們的“成色”并實(shí)現(xiàn)推送式的精準(zhǔn)分發(fā),,必須充分運(yùn)用人工智能技術(shù)。這也就是為什么習(xí)近平同志在2019年1月25日的中央政治局集體學(xué)習(xí)時(shí)講話中,,要求“探索將人工智能運(yùn)用在新聞采集,、生產(chǎn)、分發(fā),、接收,、反饋中” 。通俗地說(shuō),,就是要“互聯(lián)網(wǎng)技術(shù)產(chǎn)生的問(wèn)題,,用互聯(lián)網(wǎng)技術(shù)來(lái)解決”。

維護(hù)互聯(lián)網(wǎng)平臺(tái)上內(nèi)容的真實(shí)性和健康性是一個(gè)國(guó)際性課題,。前不久,,在美國(guó)參與的“數(shù)字時(shí)代的美國(guó)新舊媒體”考察活動(dòng)給了我切身體驗(yàn)。中國(guó)和美國(guó)這兩個(gè)不同社會(huì)制度的國(guó)家,,都面臨著互聯(lián)網(wǎng)平臺(tái)帶來(lái)的各種挑戰(zhàn),,其中互聯(lián)網(wǎng)內(nèi)容的真實(shí)、健康和安全是最為人們關(guān)注的,。在各自國(guó)家政府和社會(huì)公眾的壓力之下,,兩個(gè)國(guó)家的互聯(lián)網(wǎng)平臺(tái)都在做出努力來(lái)解決上述問(wèn)題。這些努力的主要方面,,就是積極利用人工智能技術(shù),,開發(fā)對(duì)互聯(lián)網(wǎng)內(nèi)容進(jìn)行審核的應(yīng)用。比較分析的結(jié)果是,,中國(guó)的互聯(lián)網(wǎng)平臺(tái)在這一領(lǐng)域居于領(lǐng)先地位,。

以國(guó)內(nèi)最大的資訊分發(fā)平臺(tái)今日頭條及其系列產(chǎn)品為例,其反低俗的軟件“靈犬”,,經(jīng)過(guò)三次迭代升級(jí),,最新版本包括識(shí)別類型和模型能力的重要升級(jí),同時(shí)應(yīng)用了“Bert” 和半監(jiān)督技術(shù) ,,并在此基礎(chǔ)上使用了專門的中文語(yǔ)料,,使對(duì)存在色情低俗、暴力謾罵,、標(biāo)題黨類問(wèn)題內(nèi)容的文本識(shí)別準(zhǔn)確率提升至91%,,還能支持對(duì)含有色情低俗、血腥暴力成分的圖片的識(shí)別,。比較而言,,谷歌和臉書等平臺(tái)對(duì)虛假,、低俗類信息識(shí)別的技術(shù)路線更多是“重點(diǎn)對(duì)用戶特征(包括個(gè)人級(jí)別特征和組織級(jí)別特征)、新聞特征(包括文本特征和傳播特征)和網(wǎng)絡(luò)關(guān)系(包括用戶關(guān)系網(wǎng),、事件關(guān)系網(wǎng)和傳播路徑網(wǎng))這三個(gè)要素進(jìn)行自動(dòng)查驗(yàn)” ,,具體而言,更多依靠用戶的反饋和標(biāo)注,,以及對(duì)相關(guān)因素的一致性檢驗(yàn),,在借助人工智能和大數(shù)據(jù)對(duì)文本本身進(jìn)行更加全面的識(shí)別方面投入不足,從而導(dǎo)致相應(yīng)的技術(shù)能力無(wú)法應(yīng)對(duì)以“深偽(Deepfake)”為代表的偽造信息技術(shù)的發(fā)展,。有研究者指出,,“瑞士科學(xué)家在一篇論文中就首次對(duì)人臉識(shí)別方法檢測(cè)Deepfake的效果進(jìn)行了較為全面的測(cè)評(píng),嘗試用最前沿的人臉識(shí)別系統(tǒng)去識(shí)別假視頻,,結(jié)果錯(cuò)誤率高達(dá)95%,。所以當(dāng)前如果要求平臺(tái)對(duì)深度偽造等合成媒體內(nèi)容進(jìn)行識(shí)別和標(biāo)注,在技術(shù)上幾乎是不可能實(shí)現(xiàn)的” ,。這一事實(shí)告訴我們,,在網(wǎng)絡(luò)傳播中反虛假、反低俗,,還是要更多依靠更加先進(jìn)的人工智能應(yīng)用,,通過(guò)大數(shù)據(jù)與算法的結(jié)合,提升對(duì)各類內(nèi)容(文字,、圖片,、視頻等)的識(shí)別能力。

當(dāng)前的人工智能,,實(shí)質(zhì)上是基于對(duì)人類處理各種事務(wù)規(guī)則的算法化,,并基于大數(shù)據(jù)提供的深度學(xué)習(xí)資源而實(shí)現(xiàn)的。具體地說(shuō),,就是人們根據(jù)對(duì)于客觀事物的認(rèn)識(shí),,制定處理相關(guān)事務(wù)的規(guī)則和標(biāo)準(zhǔn),然后找到一組數(shù)學(xué)公式來(lái)模擬這個(gè)過(guò)程,,也就是形成算法,,再把算法開發(fā)成為軟件,就可以用大數(shù)據(jù)來(lái)訓(xùn)練這個(gè)軟件學(xué)會(huì)識(shí)別不同狀態(tài)和情況,,達(dá)到比較成熟的水平就可以上線運(yùn)營(yíng),代替人類來(lái)工作了,??陀^上,在這個(gè)過(guò)程中,,關(guān)鍵性的難點(diǎn)在各個(gè)環(huán)節(jié)都存在,。如人們制定的標(biāo)準(zhǔn)和規(guī)則是否科學(xué),,取決于人們對(duì)相關(guān)事物本身發(fā)展規(guī)律的認(rèn)識(shí)水平。按照馬克思的論斷,,“一種科學(xué)只有在成功地運(yùn)用數(shù)學(xué)時(shí),,才算達(dá)到了真正完善的地步”。 這需要人們對(duì)客觀規(guī)律有深刻的認(rèn)識(shí),,目前在社會(huì)科學(xué)領(lǐng)域這顯然是研究的短板,。以筆者本人近年來(lái)對(duì)主流價(jià)值觀如何體現(xiàn)為算法的研究為例,旨在面向個(gè)人推送信息以提高傳播效率的算法,,如何在社會(huì)成員個(gè)人對(duì)事件重要性的判斷與社會(huì)主體對(duì)事件重要性的判斷之間建立一致性就是一個(gè)難題,。在內(nèi)容審核方面,也存在標(biāo)準(zhǔn)和規(guī)則隨具體場(chǎng)景而變化的情況,,如越南戰(zhàn)爭(zhēng)期間著名的反戰(zhàn)新聞?wù)掌?,照片主體是一位越南小女孩衣服被汽油彈引燃而渾身赤裸奔跑,就曾經(jīng)因?yàn)椤奥懵丁保?被Facebook誤刪,。實(shí)踐中,,即使實(shí)現(xiàn)了規(guī)則和標(biāo)準(zhǔn)清晰且正確,還要能夠找到可行的算法,,建立較大規(guī)模的數(shù)據(jù)庫(kù),,還要有算力的支持。如靈犬3.0,,就投入了更大的算力,。從上述過(guò)程看,利用人工智能的深度學(xué)習(xí)來(lái)解決虛假,、低俗內(nèi)容充斥網(wǎng)絡(luò)空間的問(wèn)題,,是一個(gè)具有相當(dāng)技術(shù)難度的系統(tǒng)工程,需要假以時(shí)日,,需要付出更大的努力,。

用技術(shù)識(shí)別內(nèi)容如此之難,是不是我們就不要走這條路,,靠人工去完成這個(gè)工作呢,?很顯然,在互聯(lián)網(wǎng)傳播環(huán)境下,,這是不現(xiàn)實(shí)的,。當(dāng)前,互聯(lián)網(wǎng)技術(shù)的應(yīng)用,,已經(jīng)實(shí)現(xiàn)了在傳播的技術(shù)條件方面對(duì)用戶的普遍賦權(quán),,在中國(guó),每天都有數(shù)以億計(jì)的互聯(lián)網(wǎng)用戶活躍在各個(gè)網(wǎng)絡(luò)平臺(tái)上,以短視頻為例,,抖音等平臺(tái),,每天都有千萬(wàn)條級(jí)別的內(nèi)容上傳,今日頭條平臺(tái)每天經(jīng)審核后發(fā)布的內(nèi)容就超過(guò)60萬(wàn)條,。這是無(wú)法完全用人工去處理的,。與人工審核相比,機(jī)器審核的優(yōu)勢(shì)在于,,機(jī)器一是計(jì)算快,,一秒鐘能執(zhí)行百億次計(jì)算;二是存儲(chǔ)大,,可以輕松存儲(chǔ)千億以上漢字,;三是運(yùn)行穩(wěn)定,不會(huì)因心情,、狀態(tài),、對(duì)標(biāo)準(zhǔn)的理解等因素影響處理結(jié)果。據(jù)了解,,由于強(qiáng)化內(nèi)容標(biāo)注和審核的需要,,今日頭條的母公司“字節(jié)跳動(dòng)”已經(jīng)建立了近萬(wàn)人的審核團(tuán)隊(duì)。在“機(jī)器+人工”審核模式下,,我國(guó)主要的互聯(lián)網(wǎng)信息分發(fā)平臺(tái)的內(nèi)容安全得到了較大程度的提升,,未來(lái)隨著研究的深入、技術(shù)的進(jìn)步,,內(nèi)容審核的水平還會(huì)持續(xù)提升,。

?

打印 | 收藏 | 發(fā)給好友 【字號(hào)
關(guān)于我們 | 廣告服務(wù) | 網(wǎng)站地圖 | 網(wǎng)站公告 |
國(guó)新辦發(fā)函[2001]232號(hào) 閩ICP備案號(hào)(閩ICP備05022042號(hào)) 互聯(lián)網(wǎng)新聞信息服務(wù)許可證 編號(hào):35120170001 網(wǎng)絡(luò)文化經(jīng)營(yíng)許可證 閩網(wǎng)文〔2019〕3630-217號(hào)
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可(互聯(lián)網(wǎng)視聽節(jié)目服務(wù)/移動(dòng)互聯(lián)網(wǎng)視聽節(jié)目服務(wù))證號(hào):1310572 廣播電視節(jié)目制作經(jīng)營(yíng)許可證(閩)字第085號(hào)
網(wǎng)絡(luò)出版服務(wù)許可證 (署)網(wǎng)出證(閩)字第018號(hào) 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 閩B2-20100029 互聯(lián)網(wǎng)藥品信息服務(wù)(閩)-經(jīng)營(yíng)性-2015-0001
福建日?qǐng)?bào)報(bào)業(yè)集團(tuán)擁有東南網(wǎng)采編人員所創(chuàng)作作品之版權(quán),,未經(jīng)報(bào)業(yè)集團(tuán)書面授權(quán),,不得轉(zhuǎn)載,、摘編或以其他方式使用和傳播
職業(yè)道德監(jiān)督,、違法和不良信息舉報(bào)電話:0591-87095403(工作日9:00-12:00、15:00-18:00) 舉報(bào)郵箱:[email protected] 福建省新聞道德委舉報(bào)電話:0591-87275327