電 話:18937133779
網(wǎng) 址:http://pomisthenewpink.com
郵 箱:zboao@qq.com
檔案數(shù)字化加工掃描是一種將紙質(zhì)檔案轉(zhuǎn)換為數(shù)字格式的過(guò)程,旨在提高檔案管理效率和信息可訪問(wèn)性。該過(guò)程涉及多個(gè)步驟和技術(shù),從準(zhǔn)備工作到最終數(shù)字化文件的生成,需要系統(tǒng)性的方法和專(zhuān)業(yè)設(shè)備支持。
河南檔案掃描數(shù)字化加工
?。ㄒ唬n案整理
在掃描之前,根據(jù)檔案管理情況,按下述步驟對(duì)檔案進(jìn)行適當(dāng)整理,并視需要作出標(biāo)識(shí),確保檔案數(shù)字化質(zhì)量。
1、目錄數(shù)據(jù)準(zhǔn)備
按照《檔案著錄規(guī)則》(DA/T 18)等的要求,規(guī)范檔案中的目錄內(nèi)容,包括確定檔案目錄的著錄項(xiàng)、字段長(zhǎng)度和內(nèi)容要求。如有錯(cuò)誤或不規(guī)范的案卷題名、文件名、責(zé)任者、起止頁(yè)號(hào)和頁(yè)數(shù)等,應(yīng)進(jìn)行修改。
2、拆除裝訂
在不去除裝訂物情況下,影響掃描工作進(jìn)行的檔案,應(yīng)拆除裝訂物;將檔案原件的裝訂線拆除,排好順序,不得出現(xiàn)任何漏缺頁(yè)及順序差錯(cuò),更不能對(duì)檔案原件有任何損壞。
3、區(qū)分掃描件和非掃描件
按要求把同一案卷中的掃描件和非掃描件區(qū)分開(kāi)。普發(fā)性文件區(qū)分的原則是:無(wú)關(guān)的重份的文件要剔除,有正式件的文件可以不掃描原稿。
4、頁(yè)面修整
對(duì)破損嚴(yán)重、無(wú)法直接進(jìn)行掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù)、裱糊;
折皺不平影響掃描質(zhì)量的原件應(yīng)先進(jìn)行相應(yīng)處理(壓平或燙平等)后再進(jìn)行掃描。
5、檔案整理登記
制作并填寫(xiě)紙質(zhì)檔案數(shù)字化加工過(guò)程登記表,詳細(xì)記錄檔案整理后每份文件的起始頁(yè)號(hào)和頁(yè)數(shù)。
(二)檔案掃描
1、掃描方式(掃描前必須準(zhǔn)備一臺(tái)專(zhuān)業(yè)的平板掃描儀)
根據(jù)檔案幅面的大小(A4、A3、AO等)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)擔(dān)描儀,如
工程圖紙可采用0號(hào)圖紙掃描儀進(jìn)行掃描。
普通A4紙質(zhì)文件,采用高速掃描儀的自動(dòng)進(jìn)紙方式掃描;
紙質(zhì)過(guò)薄、透明的(如信紙、便簽紙)采用高速掃描儀的平板掃描;
紙質(zhì)過(guò)厚、照片等檔案采用高速掃描儀的平板掃描;
對(duì)文件頁(yè)面貼有附屬小頁(yè)面、紙張時(shí),將大小頁(yè)面單獨(dú)在平板中掃描;2、掃描模式(紙質(zhì)檔案掃描一般采用黑白、灰度和彩色三種模式)
頁(yè)面為黑白兩色,字跡清晰的、不帶圖片的檔案材料,采用黑白方式;
頁(yè)面為黑白兩色,清晰度較差或者帶有圖片的檔案材料,以及頁(yè)面多為彩色文字的檔案,采用彩色或灰度模式(因情況而定);
頁(yè)面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,采用彩色模式掃描。
3、分辨率選擇
采用黑白、256級(jí)灰度模式掃描的文件,其分辨率選擇為不小于300DPI;
采用24位為彩色模式掃描的文件,其分辨率選擇為不小于200DPI。(以上模式分辨率的設(shè)定以A4紙張為標(biāo)準(zhǔn),其他規(guī)格紙張酌情處理)
掃描的線數(shù)、閥值、亮度、灰度、對(duì)比度等值可根據(jù)所掃描文件材料的清晰度進(jìn)行適當(dāng)?shù)恼{(diào)整;
需要時(shí)可根據(jù)原件的清晰度適當(dāng)調(diào)整掃描分辨率。如原件質(zhì)量較差且尺寸較小,可適當(dāng)提高分辨率;反之也可相應(yīng)減少分辨率,增減的多少以掃描后圖像按原尺寸顯示后是否清晰為準(zhǔn);
粘貼折頁(yè)與表格,對(duì)于粘貼折頁(yè),可用大幅面掃描儀掃描,或先部分掃描后拼接;對(duì)部分字體很小、字跡密集的情況,可適當(dāng)提高掃描分辨率,選擇灰度掃描或彩色掃描,采用局部深化技術(shù)解決;對(duì)字跡與表格顏色深度不同的,采用局部淡化技術(shù)解決。
4、掃描登記
填寫(xiě)交接登記表,登記掃描的頁(yè)數(shù)。核對(duì)每份文件的實(shí)際掃描頁(yè)數(shù)與檔案整理時(shí)填寫(xiě)的文件頁(yè)數(shù)是否一致,不一致時(shí)應(yīng)注明具體原因和處理方法。
?。ㄈ﹫D像處理
對(duì)圖像進(jìn)行處理,以獲得最好的圖像質(zhì)量,保證圖像完整、端正、無(wú)扭區(qū)、版面無(wú)暗影、無(wú)干擾信息,主要完成圖像處理包括:去黑邊、去污點(diǎn)、糾偏等,處理完的圖像保存格式為PDF。
糾偏:對(duì)掃描過(guò)程中出現(xiàn)的偏斜圖像進(jìn)行整體糾正,包括自校和手校,保證數(shù)字圖像的偏斜角度小于1度(圖像偏斜不超過(guò)頁(yè)面內(nèi)半個(gè)文字);
旋轉(zhuǎn):按方字方向?qū)D片旋轉(zhuǎn)至正確方向,沒(méi)有文字的圖片,判斷其方向后進(jìn)行左旋、右旋、翻轉(zhuǎn)、旋轉(zhuǎn)等工具;
去污:對(duì)圖像頁(yè)面中出現(xiàn)的影響圖像質(zhì)量的雜質(zhì),去除數(shù)字圖像中影響可懂度的雜質(zhì),如去除黑邊、多余邊、污點(diǎn);
裁邊:采用彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節(jié)省存儲(chǔ)空間。
刪除空白頁(yè):將掃描后頁(yè)面之間的空白頁(yè)進(jìn)行刪除;
斷字修補(bǔ):對(duì)部分文字不清楚可進(jìn)行修補(bǔ);
反白字修正:將部分反白文字可進(jìn)行描述;
分割:將A3幅面的文件分割為兩份A4幅面的文件;
拼接:對(duì)大幅面檔案進(jìn)行分區(qū)掃描形成的多幅圖像,應(yīng)進(jìn)行拼接處理,合并為一個(gè)完整的圖像,以保證檔案數(shù)字化圖像的整體性。
?。ㄋ模﹫D像處理質(zhì)檢
主要對(duì)完成圖像深處理的檢查,不合要求的返回上一環(huán)節(jié)重新處理,如以下問(wèn)題:
由于操作不當(dāng),造成掃描的圖像文件不完整或無(wú)法清晰識(shí)別時(shí),應(yīng)重新掃描;
對(duì)圖像偏斜度、清晰度、失真度等進(jìn)行檢查。發(fā)現(xiàn)不符合圖像質(zhì)量要求時(shí),應(yīng)重新進(jìn)行圖像的處理;
圖像處理的是否得當(dāng),嚴(yán)重的應(yīng)重掃,處理不當(dāng)?shù)膽?yīng)重新處理;
掃描圖像頁(yè)碼順序是否與原文件一致,有無(wú)漏掃、多掃(重復(fù))、紙張倒置等情況;
順序:如果頁(yè)碼不連續(xù),與原文不一致,需對(duì)頁(yè)面進(jìn)行排序;
漏掃:將漏掃的頁(yè)面重新掃描,并插入到正確的位置;
多掃:將多掃頁(yè)面刪除;
倒置:不符合要求的需進(jìn)行調(diào)整,保持與原文一致。
(五)圖像存儲(chǔ)
紙質(zhì)檔案目錄數(shù)據(jù)庫(kù)中的每一份文件,都有一個(gè)與之相對(duì)應(yīng)的唯一檔號(hào),以該檔號(hào)為這份文件掃描后的圖像文件命名。多頁(yè)文件要合并為一個(gè)PDF,保存到指定的路徑,便于準(zhǔn)確掛接入庫(kù),與檔案管理軟件中的目錄建立一一對(duì)應(yīng)的關(guān)系。再將所有文檔批量轉(zhuǎn)換為可以復(fù)制、檢索利用的雙層PDF格式,然后進(jìn)行光盤(pán)刻錄,確??啼浐玫墓獗P(pán)能正確地讀出,并做好標(biāo)識(shí)標(biāo)簽。
注:禁止用Word文檔保存掃描圖像。
?。┠夸浗◣?kù)
按照《檔案著錄規(guī)則》(DA/T 18)的要求進(jìn)行著錄,建立檔案目錄數(shù)據(jù)庫(kù)。目錄建庫(kù)應(yīng)選擇通用的數(shù)據(jù)格式。所選定的數(shù)據(jù)格式應(yīng)能直接或間接通過(guò)XML文檔進(jìn)行數(shù)據(jù)交換。
注:采用人工校對(duì)或軟件自動(dòng)校對(duì)的方式,對(duì)目錄數(shù)據(jù)庫(kù)的建庫(kù)質(zhì)量進(jìn)行檢查。核對(duì)著錄項(xiàng)目是否完整、著錄內(nèi)容是否規(guī)范、準(zhǔn)確,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)要求進(jìn)行修改或重錄。
(七)數(shù)據(jù)掛接
1、掛接前的數(shù)據(jù)關(guān)聯(lián)檢查
以紙質(zhì)檔案目錄數(shù)據(jù)庫(kù)為依據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個(gè)或多個(gè)圖像存儲(chǔ)為一份圖像文件。將圖像文件存儲(chǔ)到相應(yīng)文件夾時(shí),要認(rèn)真核查每一份圖像文件的名稱與檔案目錄數(shù)據(jù)庫(kù)中該份文件的檔號(hào)是否相同,圖像文件的頁(yè)數(shù)與檔案目錄數(shù)據(jù)庫(kù)中該份文件的頁(yè)數(shù)是否一致,圖像文件的總數(shù)與目錄數(shù)據(jù)庫(kù)中文件的總數(shù)是否相同等。通過(guò)每一份圖像文件的文件名與檔案目錄數(shù)據(jù)庫(kù)中該份文件的檔號(hào)的一致性和唯一性,建立起一一對(duì)應(yīng)的關(guān)聯(lián)關(guān)系,為實(shí)現(xiàn)檔案目錄數(shù)據(jù)庫(kù)與圖像文件的批量掛接提供條件。
2、匯總掛接
檔案數(shù)字化轉(zhuǎn)換過(guò)程中形成的目錄數(shù)據(jù)庫(kù)與圖像數(shù)據(jù)庫(kù),通過(guò)質(zhì)檢環(huán)節(jié)確認(rèn)為"合格"后,通過(guò)網(wǎng)絡(luò)及時(shí)加載到數(shù)據(jù)服務(wù)器端匯總。通過(guò)編制程序或借助相應(yīng)軟件,可實(shí)現(xiàn)目錄數(shù)據(jù)對(duì)相關(guān)聯(lián)的數(shù)字圖像的自動(dòng)搜索、加入對(duì)應(yīng)的電子地址信息等,實(shí)現(xiàn)批量、快速掛接。
?。ò耍?shù)據(jù)驗(yàn)收
一個(gè)全宗的檔案,數(shù)字化轉(zhuǎn)換質(zhì)量抽檢的合格率達(dá)到95%以上(含95%)時(shí),給予以驗(yàn)收“通過(guò)”。目錄數(shù)據(jù)庫(kù)與圖像文件掛接錯(cuò)誤,或目錄數(shù)據(jù)庫(kù)、圖像文件之一出現(xiàn)不完整、不清晰、有錯(cuò)誤等質(zhì)量問(wèn)題時(shí),抽檢標(biāo)記為"不合格"。
驗(yàn)收"通過(guò)"的結(jié)論,必須經(jīng)分管領(lǐng)導(dǎo)審核、簽字后方有效。
填寫(xiě)紙質(zhì)檔案數(shù)字化交接登記表。
?。ň牛?shù)據(jù)備份
經(jīng)驗(yàn)收合格的完整數(shù)據(jù)應(yīng)及時(shí)進(jìn)行備份。著錄條目和全文數(shù)據(jù)進(jìn)行一式兩份DVD光盤(pán)刻錄。移交前檢測(cè)光盤(pán)讀取性能,抽查刻錄好的光盤(pán)影像質(zhì)量,主要包括備份數(shù)據(jù)能否打開(kāi)、數(shù)據(jù)信息是否完整、文件數(shù)量是否準(zhǔn)確等。不合格的需重新刻錄。數(shù)據(jù)備份后應(yīng)在備份介質(zhì)上標(biāo)注好盤(pán)內(nèi)文件內(nèi)容、類(lèi)別、存入日期及光盤(pán)編號(hào)等,以便查找和管理。對(duì)保密的需標(biāo)明密級(jí)。
?。ㄊ┭b訂
掃描工作完成后,拆除過(guò)裝訂物的檔案應(yīng)按檔案保管的要求重新裝訂。恢復(fù)裝訂時(shí),應(yīng)注意保持檔案的排列順序不變,做到安全、準(zhǔn)確、無(wú)遺漏。
裝訂不能損害檔案原件。裝訂時(shí)應(yīng)按原有順序裝訂,案卷不掉頁(yè)、左邊和底邊整齊,保持拆卷前的原貌,并認(rèn)真做好檔案頁(yè)碼、頁(yè)數(shù)的檢查對(duì)較。
?。ㄊ唬呙枳⒁馐马?xiàng)
掃描前必需對(duì)文檔進(jìn)行拆除裝訂物,并檢查文檔內(nèi)是否藏有干擾物(如釘書(shū)釘、碎紙等),以免產(chǎn)生卡紙、損壞掃描儀,務(wù)必保持文檔干凈送入掃描儀中;
對(duì)破損嚴(yán)重、無(wú)法進(jìn)行掃描的原件要先進(jìn)行修復(fù)、裱糊;
褶皺不平影響掃描質(zhì)量的原件應(yīng)先壓平再進(jìn)行掃描;
對(duì)紙質(zhì)過(guò)薄、透明的(如信紙、便簽紙)、紙質(zhì)過(guò)厚、照片等采用高速掃描儀的平板掃描;
對(duì)文件頁(yè)面貼有附屬小頁(yè)面、紙張時(shí),將大小頁(yè)面單獨(dú)在平板中掃描;
掃描完每一份文件,要對(duì)照原文仔細(xì)檢查掃描是否清晰、完整;
按要求使用掃描儀、清洗,并對(duì)每次使用完掃描儀進(jìn)行保潔,檢查是否關(guān)閉電源;
紙質(zhì)檔案數(shù)字化成果提供網(wǎng)上檢索利用時(shí),應(yīng)有制作單位的電子標(biāo)識(shí),并根據(jù)具體情況分別采用可下載或不可下載的數(shù)據(jù)格式。
總之,檔案數(shù)字化加工掃描不僅是一種技術(shù)進(jìn)步,更是檔案管理現(xiàn)代化的重要步驟。隨著技術(shù)的不斷發(fā)展和應(yīng)用范圍的擴(kuò)大,數(shù)字化檔案將在各個(gè)領(lǐng)域發(fā)揮越來(lái)越重要的作用,為信息化時(shí)代的發(fā)展貢獻(xiàn)力量。
檔案數(shù)字化掃描加工注意事項(xiàng)
在當(dāng)今信息化發(fā)展迅速的時(shí)代,檔案數(shù)字化掃描加工是保護(hù)和利用檔案資源的重要手段之一。通過(guò)數(shù)字化,可以有效管理、保存和利用大量的紙質(zhì)檔案,提高檔案信息的可訪問(wèn)性和利用效率。然而,檔案數(shù)字化掃描加工涉及到一系列的注意事項(xiàng)和技術(shù)要求,需要在操作過(guò)程中嚴(yán)格遵守相關(guān)規(guī)范,確保數(shù)字化成果的質(zhì)量和長(zhǎng)期可持續(xù)性。
1.選擇合適的掃描設(shè)備:
選擇分辨率高、色彩還原度好的掃描設(shè)備,以保證數(shù)字化結(jié)果的清晰度和質(zhì)量。
考慮掃描速度和掃描容量,確保設(shè)備能夠高效完成大量檔案的掃描工作。
2.檔案準(zhǔn)備工作:
對(duì)紙質(zhì)檔案進(jìn)行預(yù)處理,如去除金屬夾子、塑料封套等,確保掃描過(guò)程中不會(huì)損壞掃描設(shè)備或檔案本身。
按照檔案的重要性和特殊性分類(lèi)、編號(hào),便于后續(xù)的管理和檢索。
3.掃描操作流程:
保持檔案的原始順序和完整性,在掃描過(guò)程中避免遺漏或錯(cuò)位。
定期檢查掃描設(shè)備的清潔度,防止灰塵和污漬影響掃描效果。
4.數(shù)字化文件格式選擇:
根據(jù)檔案的具體需求選擇合適的文件格式,如PDF、TIFF等,考慮文件大小、可讀性和長(zhǎng)期保存的穩(wěn)定性。
5.質(zhì)量控制與檢驗(yàn):
建立數(shù)字化質(zhì)量控制標(biāo)準(zhǔn)和檢測(cè)方法,確保掃描結(jié)果符合要求。
對(duì)關(guān)鍵檔案進(jìn)行復(fù)核和驗(yàn)證,防止信息丟失或掃描誤差。
總之,檔案數(shù)字化掃描加工是檔案管理現(xiàn)代化的重要步驟,正確的操作和嚴(yán)格的注意事項(xiàng)可以有效保證數(shù)字化成果的質(zhì)量和可持續(xù)性。
檔案數(shù)字化掃描格式類(lèi)型
在進(jìn)行紙質(zhì)檔案數(shù)字化掃描時(shí),需要選擇適當(dāng)?shù)奈募袷絹?lái)存儲(chǔ)掃描后的圖像或文檔。紙質(zhì)檔案數(shù)字化掃描格式是為了方便存儲(chǔ)、管理和利用數(shù)字化檔案而選擇的一種將紙質(zhì)文件轉(zhuǎn)換為數(shù)字形式時(shí)所使用的特定文件格式。紙質(zhì)檔案數(shù)字化掃描格式包括以下這些類(lèi)型:
1、PDF(Portable Document Format):PDF是一種通用的文檔格式,可以存儲(chǔ)文本、圖像、表格和其他多媒體內(nèi)容。PDF文件可以在各種設(shè)備和操作系統(tǒng)上保持一致的呈現(xiàn)效果,并且支持文本搜索和可編輯性。
2、JPEG(Joint Photographic Experts Group):這是一種廣泛使用的圖像格式,適合存儲(chǔ)彩色照片和復(fù)雜圖像。它采用有損壓縮,可以在文件大小和圖像質(zhì)量之間取得平衡。
3、PNG(Portable Network Graphics):PNG是一種支持透明背景和壓縮的圖像格式。它適合存儲(chǔ)圖標(biāo)、簡(jiǎn)單圖形和帶有透明度的圖像。
4、TIFF(Tagged Image File Format):這是一種無(wú)損的圖像格式,適合保存高質(zhì)量的圖像。TIFF文件通常比JPEG文件更大,但可以保留更多的細(xì)節(jié)和顏色信息。
5、OCR(光學(xué)字符識(shí)別):OCR不是一種文件格式,而是一種技術(shù),可以將掃描的紙質(zhì)文檔轉(zhuǎn)換為可編輯的文本文檔。OCR技術(shù)可以將掃描后的圖像中的文字識(shí)別出來(lái),并生成可編輯的文本文件。
6、DOC(Microsoft Word文檔):DOC格式是Microsoft Word的原始文檔格式,可以存儲(chǔ)文本、表格、圖像和其他格式的內(nèi)容。DOC文件可以在Microsoft Word程序中進(jìn)行編輯和處理。
7、TXT(純文本文檔):TXT格式是一種純文本格式,只能存儲(chǔ)文本內(nèi)容,不支持文本格式和圖像。TXT文件可以在各種文本編輯器中打開(kāi)和編輯。
總之,選擇中博奧檔案管理系統(tǒng)進(jìn)行檔案數(shù)字化加工時(shí),需要依據(jù)具體的需求和應(yīng)用場(chǎng)景,來(lái)選擇不同特點(diǎn)和用途的紙質(zhì)檔案數(shù)字化掃描格式,具體來(lái)說(shuō),需要考慮文件類(lèi)型、可編輯性、文件大小、存儲(chǔ)需求以及兼容性和可訪問(wèn)性等因素來(lái)確定最合適的格式。
檔案數(shù)字化加工掃描意義
在當(dāng)今數(shù)字化快速發(fā)展的時(shí)代,檔案數(shù)字化加工掃描不僅僅是一種技術(shù)進(jìn)步,更是對(duì)文化遺產(chǎn)和信息管理方式的革新。通過(guò)將傳統(tǒng)紙質(zhì)檔案轉(zhuǎn)變?yōu)殡娮痈袷?,不僅提升了信息存儲(chǔ)和傳播的效率,還有效保護(hù)了歷史文化遺產(chǎn),滿足了信息化時(shí)代對(duì)高效管理和便捷獲取信息的需求。
1.保護(hù)和保存歷史文化遺產(chǎn):
檔案數(shù)字化使得珍貴的歷史文獻(xiàn)、藝術(shù)作品等得以長(zhǎng)期保存,并通過(guò)備份和復(fù)制避免了紙質(zhì)檔案易于損壞或丟失的風(fēng)險(xiǎn)。
數(shù)字化檔案可以通過(guò)云存儲(chǔ)和在線數(shù)據(jù)庫(kù)共享,使得全球范圍內(nèi)的研究人員和學(xué)者能夠輕松訪問(wèn)和利用這些文化資料。
2.提升信息管理效率:
數(shù)字化檔案可以實(shí)現(xiàn)快速檢索、分類(lèi)和索引,大大節(jié)省了查找信息所需的時(shí)間和人力成本。
檔案數(shù)字化也促進(jìn)了各種行業(yè)和領(lǐng)域的信息共享和協(xié)作,促進(jìn)了跨學(xué)科研究和知識(shí)創(chuàng)新。
3.推動(dòng)社會(huì)發(fā)展與服務(wù)改進(jìn):
在教育、醫(yī)療、法律等行業(yè),數(shù)字化檔案使得歷史病例、法律文書(shū)等信息更容易訪問(wèn)和分析,提升了服務(wù)質(zhì)量和效率。
政府部門(mén)通過(guò)數(shù)字化檔案管理系統(tǒng)提升了政策制定和實(shí)施的精準(zhǔn)性和透明度,為公眾提供了更好的政務(wù)服務(wù)體驗(yàn)。
綜上所述,檔案數(shù)字化加工掃描不僅僅是信息技術(shù)的應(yīng)用,更是社會(huì)文化進(jìn)步和傳承的重要保障。隨著技術(shù)的不斷發(fā)展和應(yīng)用的普及,我們期待數(shù)字化檔案能夠在更廣泛的領(lǐng)域發(fā)揮作用,為保護(hù)文化遺產(chǎn)、提升信息管理效率以及促進(jìn)跨界合作與創(chuàng)新提供更加堅(jiān)實(shí)的基礎(chǔ)和支持。
(全國(guó)總部)河南省鄭州市金水區(qū)博雅廣場(chǎng)4號(hào)樓1104
+18937133779
zboao@qq.com
中博奧技術(shù)有限公司& 版權(quán)所有
工信部備案號(hào):豫ICP備11015869號(hào)-8