fjrigjwwe9r0t_Template:TContent
天天躁日日躁狠狠躁2020,韩国偷拍一区二区三区电影 97久精品国产片一区二区三区,波多野结衣高清无码视频,久久99国产综合精品免费,丰满少妇一区二区三区,中国东北少妇BBB真爽
 
云因公司與平章公司強(qiáng)強(qiáng)整合 全面推進(jìn)出版行業(yè)信息化建設(shè)
 
 
 
 
  新聞中心   
 
專家視點(diǎn) 您的位置:網(wǎng)站首頁-新聞中心 -專家視點(diǎn)
 云章動(dòng)態(tài)
 行業(yè)新聞
 專家視點(diǎn)
 
我國(guó)出版業(yè)信息化建設(shè)綜述
作者:黃凱卿 發(fā)布時(shí)間:2010-01-01 【選擇字體:

  1.3 電腦校對(duì)技術(shù)的發(fā)展
  電腦校對(duì)是出版社的一項(xiàng)重要的計(jì)算機(jī)應(yīng)用項(xiàng)目,它能提高校對(duì)速度,減少差錯(cuò)率。目前國(guó)內(nèi)出版部門使用的中英文校對(duì)軟件主要有中文校對(duì)軟件“黑馬編校2000”、“金山WPS2000”、“工智校對(duì)通”等,英文校對(duì)軟件有“MS WORD 97/2000”、“黑馬編校2000(有英文單詞校對(duì)功能)”等。校對(duì)軟件比人力校對(duì)能力強(qiáng),而且不存在疲憊與疏忽問題。不過,校對(duì)軟件在根據(jù)上下文意進(jìn)行差錯(cuò)判斷方面就不如人力校對(duì)。所以,出版界提倡人腦校對(duì)與電腦校對(duì)相結(jié)合。目前,大多數(shù)出版社直接在市場(chǎng)上購買校對(duì)軟件加以使用,少數(shù)技術(shù)力量較強(qiáng)的出版社自主開發(fā)專業(yè)化校對(duì)軟件(如浙江科學(xué)技術(shù)出版社開發(fā)出 “浙江科學(xué)技術(shù)出版社校對(duì)信息管理系統(tǒng)”)[24]。
  由于漢語的計(jì)算機(jī)處理起步較晚,而且漢語的處理又比英語困難得多,所以漢語校對(duì)系統(tǒng)與英語校對(duì)系統(tǒng)很不一樣。目前的漢語校對(duì)系統(tǒng)大致有三種類型:
  1)同一文本兩人分別錄入,計(jì)算機(jī)逐字比對(duì)的方法。這種校對(duì)方法準(zhǔn)確性高,但時(shí)效性不強(qiáng),錄入工作量大了一倍,且無法查出原稿中的錯(cuò)誤,故一般較少用這種方法。
  2)語言校對(duì)方法。先由語音合成系統(tǒng)讀出錄入的文句,再由錄入員或校對(duì)員對(duì)照原稿進(jìn)行檢查。這種方法能查出錄入稿和原稿的異同,減輕校對(duì)的工作量,但不能發(fā)現(xiàn)同音異體錯(cuò)字,也沒有錯(cuò)誤提示功能,還查不出原稿中的錯(cuò)誤。
  3)采用計(jì)算機(jī)語言學(xué)原理核查錄入錯(cuò)誤的方法。先建一個(gè)輸有大批語言材料的詞語庫,統(tǒng)計(jì)并建立詞語搭配關(guān)系表、語法規(guī)則庫、相關(guān)知識(shí)庫、資料庫等作為校對(duì)的依據(jù)。校對(duì)時(shí)先用詞語庫對(duì)校對(duì)文稿進(jìn)行分析,再利用各種表、規(guī)則、知識(shí)庫、資料庫將文稿中被懷疑有錯(cuò)之處在顯示器上標(biāo)出供人們判斷,并且給出修改建議,提供修改手段。
  很明顯,第三種方法是目前最好的校對(duì)方法。它能查出作者原稿中的錯(cuò)誤、同音字錯(cuò)誤、近形字錯(cuò)誤、多字、漏字、各種錄入誤碼錯(cuò)誤等,還為作者、校對(duì)人員、編輯人員提供了許多輔助功能。市售的“工智校對(duì)通”、“黑馬”、“方正”、“文捷”、“三歐”、“北成”等校對(duì)軟件都屬這類。不過,目前各種校對(duì)軟件都查不出語義錯(cuò)誤,知識(shí)性錯(cuò)誤、事實(shí)性錯(cuò)誤、某些單句語法錯(cuò)誤和篇章語法錯(cuò)誤、大多數(shù)標(biāo)點(diǎn)錯(cuò)誤,有時(shí)還存在誤判問題[15]。
  2 數(shù)據(jù)輸入技術(shù)產(chǎn)品的信息化建設(shè)
  目前我國(guó)的鍵盤編碼漢字輸入方法已經(jīng)比較成熟。近幾年一直受到廣泛關(guān)注的信息非鍵盤輸入技術(shù)是1997年正式提出來的,它是指在常規(guī)鍵盤輸入技術(shù)之外的手寫識(shí)別、印刷文稿光學(xué)字符識(shí)別(OCR)以及語音識(shí)別技術(shù)。非鍵盤輸入領(lǐng)域目前有北京漢王、IBM、清華紫光、Motorola、Microsoft、清華文通、香港金山、Intel、北京大恒、臺(tái)灣蒙恬等多家公司在互相競(jìng)爭(zhēng)。經(jīng)過20多年的研究和發(fā)展,中文連續(xù)語音識(shí)別技術(shù)的實(shí)用產(chǎn)品已經(jīng)問世,印刷體漢字OCR技術(shù)已相當(dāng)成熟,手寫漢字的OCR技術(shù)也有很大的進(jìn)步,文字信息輸入市場(chǎng)已經(jīng)進(jìn)入鍵盤、手寫、語音和掃描的混合競(jìng)爭(zhēng)時(shí)代。其中清華文通的手寫技術(shù),漢王和清華紫光的漢字OCR技術(shù)和產(chǎn)品,IBM的漢語普通話連續(xù)語音識(shí)別輸入技術(shù)和ViaVoice語音識(shí)別產(chǎn)品,都是主導(dǎo)市場(chǎng)的技術(shù)與產(chǎn)品。Microsoft公司也宣布成立Microsoft中國(guó)研究院,主攻語音識(shí)別、圖像技術(shù)、自然語言和多媒體輸入技術(shù)的研究與開發(fā)。Intel公司雖然沒有推出自己的語音識(shí)別技術(shù)產(chǎn)品,但卻提供了包括信號(hào)處理庫、識(shí)別庫、圖像處理庫和數(shù)字核心庫等高性能語音函數(shù)庫,為使計(jì)算機(jī)具有說話能力打下堅(jiān)實(shí)的基礎(chǔ)[14] 。
  2.1 手寫板和手寫筆輸入技術(shù)與設(shè)備
  手寫板和手寫筆大多配套使用,所以兩者常相互指稱。目前有三種手寫板:電阻式壓力板、電磁式感應(yīng)板和電容式觸控板。電阻式壓力板由一層可變形電阻薄膜和一層固定電阻薄膜構(gòu)成,中間由空氣相隔離。當(dāng)筆或手指書寫時(shí)對(duì)上層電阻加壓使之變形而與下層電阻接觸,使下層電阻薄膜感應(yīng)出筆或手指的位置。其原理簡(jiǎn)單,成本低,價(jià)格便宜,但對(duì)手指感觸不靈敏,使用時(shí)壓力大小較難掌握,且感應(yīng)材料使用壽命較短,故已很少采用。目前國(guó)內(nèi)流行的手寫輸入產(chǎn)品(如漢王筆、紫光筆、大恒筆等)大多是電磁式感應(yīng)板。當(dāng)手寫板下方的布線電路通電之后,即可在一定空間范圍形成電磁場(chǎng),來感應(yīng)帶線圈的筆尖的書寫工作。其性能良好,書寫流暢,能感應(yīng)筆畫的粗細(xì),著色的濃淡;不過它對(duì)供電有專門的要求,否則電磁板工作就不穩(wěn)定甚至不能工作;此外它的手寫筆筆尖的使用壽命較短,也不能用手指直接書寫。針對(duì)前兩種手寫板的缺陷,誕生了智能電容式觸控手寫板,它通過人體電容來感知手指的位置。當(dāng)手指接觸到觸控板的瞬間,板的表面會(huì)產(chǎn)生電容;觸控板表面附著的傳感矩陣與一塊特殊芯片一起持續(xù)跟蹤人的手指電容的“軌跡”,再經(jīng)過儀器的內(nèi)部處理,就能精確定位手指的位置(X、Y坐標(biāo)),并測(cè)出手指與板間的距離(壓力大。┬纬傻碾娙葜担ù_定Z坐標(biāo))。這種觸感筆無須電源,性能良好,用手指和筆都能操作,使用壽命可達(dá)30年,特別適合便攜式產(chǎn)品。手寫筆是手寫輸入系統(tǒng)中的一種,早期輸入筆的尾部帶有一根與手寫板相連的電纜,也稱有線筆。較先進(jìn)的輸入筆在筆殼內(nèi)裝有電池,或者借助技術(shù)而不需任何電源,也稱為無線筆。它攜帶使用方便,故障較少,筆上有兩或三個(gè)類似鼠標(biāo)一樣的按鍵,使其能同時(shí)發(fā)揮手寫筆和鼠標(biāo)的作用[27]。
  2.2 語音輸入技術(shù)與設(shè)備
  語音輸入技術(shù)最受廣大用戶的歡迎。我國(guó)語音識(shí)別技術(shù)的研究始于20世紀(jì)50年代初的中國(guó)社會(huì)科學(xué)院語言研究所對(duì)漢語各種發(fā)音的研究。1958年,中科院電子學(xué)研究所用電子管做成的帶通濾波器只能識(shí)別十幾個(gè)發(fā)音,1972年開始利用電子計(jì)算機(jī)進(jìn)行語音識(shí)別研究,并于1978年研制出國(guó)內(nèi)第一個(gè)可識(shí)別200多條語音命令的實(shí)時(shí)語音識(shí)別系統(tǒng)。20世紀(jì)80年代后,計(jì)算機(jī)應(yīng)用逐漸普及,數(shù)字信號(hào)處理技術(shù)進(jìn)一步得到發(fā)展,國(guó)內(nèi)許多單位都具備了研究語音技術(shù)的基本條件。與此同時(shí),國(guó)外也重新開展語音識(shí)別技術(shù)的研究并迅速取得進(jìn)展。這時(shí),中科院聲學(xué)所和自動(dòng)化所、清華大學(xué)、北方交通大學(xué)等進(jìn)入該研究領(lǐng)域,我國(guó)863智能計(jì)算機(jī)專家組還為語音識(shí)別技術(shù)專門設(shè)立了題為“英漢自然語言翻譯系統(tǒng)”(包括漢語語音識(shí)別、漢英文本翻譯和英語語音合成三部分)的首期科研項(xiàng)目,第二期單獨(dú)為語音識(shí)別研究立項(xiàng)。不僅如此,國(guó)家863智能計(jì)算機(jī)專家組和中國(guó)自動(dòng)化學(xué)會(huì)、中國(guó)計(jì)算機(jī)學(xué)會(huì)、中國(guó)電子學(xué)會(huì)、中國(guó)聲學(xué)學(xué)會(huì)、中國(guó)中文信息學(xué)會(huì)、中國(guó)通信學(xué)會(huì)6個(gè)學(xué)會(huì)的有關(guān)機(jī)構(gòu)每年都要召開全國(guó)人機(jī)語音通信學(xué)術(shù)會(huì)議。1991年以來,每1~2年他們就舉辦一次全國(guó)語音識(shí)別系統(tǒng)的評(píng)測(cè),并為評(píng)測(cè)建立了專門的語音數(shù)據(jù)庫。目前,我國(guó)語音識(shí)別技術(shù)的研究已取得令人矚目的成績(jī),其基礎(chǔ)研究涉及漢語語音學(xué)、聽覺模型、人工神經(jīng)網(wǎng)絡(luò)、小波變換理論和分?jǐn)?shù)維方法等,在識(shí)別模型和算法方面取得了下列成果:描述語音過程最好模型的HMM算法;神經(jīng)網(wǎng)語音識(shí)別模型;神經(jīng)網(wǎng)模型與HMM模型的結(jié)合;DTW算法及VQ算法研究;模糊識(shí)別方法的應(yīng)用等。1995年我國(guó)首次研制出非特定人、連續(xù)語音漢字聽寫機(jī),1998年測(cè)試時(shí)漢字正確識(shí)別率達(dá)到94%。目前,我國(guó)語音識(shí)別研究已進(jìn)入大詞匯量、非特定人、連續(xù)語音識(shí)別的高級(jí)階段[26]。不過,目前世界上漢語普通話連續(xù)語音識(shí)別技術(shù)與設(shè)備市場(chǎng)的主導(dǎo)技術(shù)與產(chǎn)品都是美國(guó)IBM公司的ViaVoice技術(shù)與產(chǎn)品,我國(guó)語音識(shí)別裝置的核心部件也是采用IBM公司的產(chǎn)品。
上一頁 [ 1 ] [ 2 ] [ 3 ] [ 4 ] [ 5 ] 下一頁
關(guān)于云章 | 常見問題 | 資料下載 | 聯(lián)系我們
版權(quán)所有©北京云章科技有限公司

編號(hào): 京ICP備15007995號(hào)-4
京公網(wǎng)安備11010802030842
  地址:北京市海淀區(qū)蘇州街18號(hào)院長(zhǎng)遠(yuǎn)天地大廈A1座601、B2座1110
電話:13601051627   15910670880  
郵箱: mail@pzcp.com