電 話:18937133779
網(wǎng) 址:http://pomisthenewpink.com
郵 箱:zboao@qq.com
一、掃描規(guī)范
1、掃描設備:使用高分辨率圖像掃描儀,圖像分辨率設置在300dpi以上;
2、掃描格式:掃描的圖紙文件以TIFF格式保存;
3、圖像質(zhì)量:掃描的圖紙文件需要保證圖像質(zhì)量,無污染、無折痕、無變形、無錯誤;
4、文件命名:掃描的圖紙文件命名需要統(tǒng)一,以圖紙編號為基礎,如:圖紙編號-圖紙名稱-版本號;
5、圖紙分解:掃描的圖紙文件需要按照圖紙編號分解成多個文件;
6、圖紙校對:掃描的圖紙文件需要與原件進行校對,確保掃描的圖紙文件與原件無差異。
二、掃描后的文件管理
1、文件存儲:掃描的圖紙文件需要存儲在指定的文件夾中,以便于管理;
2、文件備份:掃描的圖紙文件需要定期備份,以便于進行數(shù)據(jù)恢復;
3、文件安全:掃描的圖紙文件需要加密,以確保文件的安全;
4、文件管理:掃描的圖紙文件需要進行定期的管理,以便于查閱和檢索。
相比于檔案目錄信息的輸入存儲,檔案全文的錄入和存儲組織工作要復雜得多,必須建立起一套工作流程和技術規(guī)范,以保障未來網(wǎng)上檔案信息的高質(zhì)量和統(tǒng)一性,確保檔案、圖書、情報等各類信息最大限度的一體化,并為今后技術的發(fā)展留下兼容和擴充的余地。整個檔案掃描一包括這幾個環(huán)節(jié): 批量的把紙介質(zhì)的文檔、檔案、書本雜志等用掃描儀進行掃描。目前通常用高拍儀或者高速掃描儀來進行文檔掃描。 通常檔案掃描的最后一個環(huán)節(jié)是管理這些掃描后的電子化文件,如“文檔管理系統(tǒng)”、“知識管理系統(tǒng)”,就屬于這類型的管理軟件。通過對這些電子化文件的管理,查詢利用就非常的方便了。
紙質(zhì)檔案數(shù)字化技術規(guī)范DA/T31-2005
1 范圍
本標準規(guī)定了紙質(zhì)檔案數(shù)字化的主要技術要求。
本標準適用于用掃描儀對各種紙質(zhì)檔案的數(shù)字化加工處理。
2 規(guī)范性引用文件
下列文件中的條款通過本標準的引用而成為本標準的條款。凡是注日期的引用文件,其隨后所有的修改單(不包括勘誤的內(nèi)容)或修訂版均不適用于本標準,然而,鼓勵根據(jù)本標準達成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標準。
GB/T 17235.1 連續(xù)色調(diào)靜態(tài)圖像的數(shù)字壓縮編碼
GB/T 17235.2 連續(xù)色調(diào)靜態(tài)圖像的數(shù)字壓縮編碼
GB/T 18894?2002 電子文件歸檔與管理規(guī)范
ITU(CCITT)G3 二值圖像壓縮算法
ITU(CCITT)G4 二值圖像壓縮算法
DA/T18?1999 檔案著錄規(guī)則
檔案管理軟件功能要求暫行規(guī)定國家檔案局檔發(fā)[2001]6號
3 術語和定義
下列術語和定義適用于本標準。
3.1
數(shù)字化 Digitization
用計算機技術將模擬圖像轉(zhuǎn)換為數(shù)字圖像的處理過程。
3.2
紙質(zhì)檔案數(shù)字 化Digitization of Paper?Based Records
對普通(黑色字跡清晰)的油印、鉛印、膠印等印刷件或復印件紙質(zhì)檔案進行數(shù)字化及應用的過程。
3.3
數(shù)字圖像 Digital Image
表示景物圖像的整數(shù)陣列。一個二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的連續(xù)圖像產(chǎn)生。在矩陣(或其他)網(wǎng)絡上采樣一連續(xù)函數(shù),并在采樣點上將值最小化后的陣列。
3.4
黑白二值圖像 Binary Image
只有黑白兩級灰度的數(shù)字圖像。它對應于黑和白的兩種狀態(tài)文字稿、線條圖、指紋圖等。
3.5
連續(xù)色調(diào)靜態(tài)圖像 Continuous?tone Still Image
以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字
圖像。
3.6
失真度 Distortion Measure
對檔案原件進行數(shù)字化轉(zhuǎn)換后,在同等測試環(huán)境下,數(shù)字圖像與檔案原
件色彩、幾何、壓縮算法等差值。
3.7
可懂度 intelligibility
表示數(shù)字圖像向人或機器提供信息的能力。
3.8
清除圖像冗余或?qū)D像近似的任一種過程,其目的是對圖像以更緊湊的形式表現(xiàn)。
3. 9
分辨率 Resolution
指單位長度內(nèi)圖像包含的點數(shù)或像素數(shù)。
3.10
TIFF Tagged Tmage File Format
標記圖像文件格式。一種基于標記的無損(不丟失信息)壓縮格式,用于在應用程序之間和計算機平臺之間交換文件。因為它存儲圖像細微層次的信息非常多,圖像的質(zhì)量也得以提高,故而非常有利于原件為黑白檔案的復制儲存。
3.11
JPEG Joint photographic Experts Group
聯(lián)合照片專家組。一種丟失少量信息的壓縮格式,尤其適用于屏幕和打印顯示,支持所有主要計算機平臺和Web瀏覽器。JPEG格式文件小,影像質(zhì)量多數(shù)情況下均可接受??紤]儲存空間及傳輸效率,原件為彩色的檔案可遷此格式復制儲存。
4 數(shù)字化基本流程
紙質(zhì)檔案數(shù)字化的基本流程主要包括案卷整理、目錄建庫、批量掃描、數(shù)據(jù)處理、信息存儲、檢索利用等工序。
4.1 案卷整理
對需要掃描的案卷進行適當整理,做出標識。
4.2 目錄建庫
為數(shù)字化的檔案檢索而建立必要的目錄數(shù)據(jù)庫。
4.3 批量掃描
按照檔案數(shù)字化具體任務的整體安排按計劃分批次進行掃描。
4.4 數(shù)據(jù)處理
4.4.1 對掃描圖像進行校對,確保圖像完整無誤,并視需要對有問題的掃描圖像進行糾偏、去污、拼接等技術處理。
4.4.2 對裸數(shù)據(jù)進行驗收前的相應處理,包括文件的格式轉(zhuǎn)換、邏輯分盤處理、添加說明性文件,以及數(shù)據(jù)的掛接、檢驗、上載、質(zhì)量檢查和備份。
4.5 信息存儲
根據(jù)不同的掃描圖像選擇適當數(shù)據(jù)格式、編碼方式和存儲介質(zhì)對信息進行保存。
4.6 檢索利用
按用戶需求提供檢索利用。
5 案卷整理
在批量掃描之前,按下述步驟對案卷進行整理,確保檔案數(shù)字化質(zhì)量。
5.1 分件
5.1.1 把同一案卷中的掃描件和非掃描件分開。
5.1.2 在掃描件中將大圖、照片插入指示頁,便于掃描工序批量掃描,實際圖像放在圖像處理時進行重掃,替換指示頁。
5.1.3 填寫《數(shù)據(jù)加工過程處理單》(見附錄A),對需要特殊處理的頁,標識清楚。
5.2 分頁
對批量掃描前的檔案進行頁號、件號的標注。如在標注中與原檔案中的件數(shù)、頁號不一致,應以此為準。
5.3 拆卷
去除檔案中原來的裝訂物,以便后續(xù)掃描工作的進行。
5.4 裝卷
按檔案保管要求恢復原裝訂。
6 建目錄庫
6.1 目錄著錄
根據(jù)DA/T18確定檔案著錄項,并進行著錄。
6.2 數(shù)據(jù)格式選擇
所選定的數(shù)據(jù)格式通用,應能直接或間接與DBF文件格式或通過XML文
檔進行數(shù)據(jù)交換。
6.3 目錄輸入
將著錄好的目錄輸入計算機內(nèi),建立機讀目錄數(shù)據(jù)庫。
7 批量掃描
7.1 掃描方式
紙質(zhì)檔案掃描可采用黑白二值圖像和連續(xù)色調(diào)圖像兩種方式。
7.1.1 頁面為單色文字的紙質(zhì)檔案,宜采用黑白二值圖像掃描;頁面為多色文字圖像的檔案文件,可采用連續(xù)色調(diào)圖像掃描。
7.1.2 字跡清晰、不帶圖片的檔案材料,采用黑白二值圖像掃描;清晰度較差或帶有圖片的檔案材料,可采用連續(xù)色調(diào)圖像掃描。
7.2 分辨率選擇
7.2.1 單色頁面檔案文件,掃描分辨率一般建議選擇100~200dpi。
7.2.2 彩色頁面檔案文件,掃描分辨率可選擇100dpi以上參數(shù)值進行。
7.2.3 大幅面檔案文件,如工程圖紙、報紙等尺寸超過A3的,可選用大幅面圖像掃描儀(如A0)、大幅面數(shù)碼平臺、縮微照像后膠片數(shù)字轉(zhuǎn)換,也可以采用小幅面掃描后的圖像拼接。掃描分辨率應選擇1OOdpi以上。
7.2.4 需要時可根據(jù)原件的清晰度適當調(diào)整掃描分辨率。如原件質(zhì)量較差且尺寸較小,可適當提高分辨率;反之也可相應減少分辨率,增減的多少以掃描后圖像按原尺寸顯示后是否清晰為準。
7.3 特殊頁面的掃描
7.3.1 粘貼頁與表格
對于粘貼折頁,可用大幅面掃描儀掃描,或先分部掃描后拼接;對部分字體很小、字跡密集的情況,可適當提高掃描分辨率,選擇灰度掃描或彩色掃描,采用局部深化技術解決;對字跡與表格顏色深度不同的,采用局部淡化技術解決
7.3.2 一般文本流程圖
采用適當?shù)姆直媛蕭呙杓熬植可罨夹g,確保文本流程圖清晰。同時采用不同設備滿足文本流程圖的掃描工作。
7.3.3 插圖
采用高分辨率灰度或彩色掃描技術將插圖與文字一起掃描,保證原來的頁面布局和插圖清晰。
7.3. 4照片
對于頁面中有黑白或彩色照片的文件,采用JPEG格式掃描,確保照片清晰度,同時可避免圖像存儲空間過大。
7.4 文件命名方式
7.4.1 建立文件夾
掃描時文件夾的建立應按檔案實體分級建立,其中的每一份文件也需要單獨建立文件夾。
7.4.2 文件夾命名方法,以檔案實體中的檔號命名,一般為3位數(shù),不足3
位數(shù)的左邊補“0”。
8 數(shù)據(jù)處理
8.1 圖像處理
8.1.1 糾偏
對掃描過程中出現(xiàn)的偏斜圖像進行整體糾正,保證數(shù)字圖像的偏斜角度小于1度。(圖像偏斜不超過頁面內(nèi)半個文字)。
8.1.2 去污
去除數(shù)字圖像中影響可懂度的雜質(zhì)。檔案數(shù)字化圖像的去污,應遵循在不影響可懂度的前提下展現(xiàn)原貌的原則。
8.1.2.1 局部去污,如去除黑邊、污點。
8.1.2.2 整體去污,可一次性去除頁面上的污漬。
8.1.3 拼接
為保證檔案數(shù)字化圖像的整體性,對幅面分離的數(shù)字圖像進行拼接。
8.1.4 校對
8.1.4.1 一次校對,檢查掃描完的圖像質(zhì)量情況,對不合格的圖像進行標記退回重新掃描。
8.1.4.2 糾錯處理,根據(jù)一次校對中提出的諸如污漬、黑邊、偏斜、圖像質(zhì)
量等問題,結合《數(shù)據(jù)加工過程處理單》(見附錄A)情況,對每份圖像進行相應的處理。
8.1.4.3 二次校對,對一次校對及數(shù)據(jù)處理后的數(shù)字圖像再次進行檢查,并
標記圖像處理過程中不清晰的頁面。不合格的退回重新處理。
8.2 數(shù)據(jù)質(zhì)量檢查
8.2.1 文字錄入質(zhì)量
對錄入域清單上所標明的各著錄項的文字錄入進行正確率控制,保證錯誤率低于3‰。
8.2.2 圖像質(zhì)量
對紙質(zhì)文件掃描后形成的圖像文件進行清晰度、污漬、黑邊、偏斜等問題的控制,以達到要求的圖像質(zhì)量。
保證掃描后的數(shù)字圖像清晰,便于清楚閱讀,適應各種紙張和手寫、印刷字的情況。
8.3 數(shù)據(jù)掛接
檔案條目數(shù)據(jù)與圖像文件的對應準確程度的控制。
在生成裸數(shù)據(jù)光盤之前,根據(jù)資料整理信息、掃描前的標引信息及卷內(nèi)文件頁號信息核查圖像文件總數(shù)是否與實際文件數(shù)相等,如不相等則不能生成裸數(shù)據(jù)光盤,可打印出清單,回退給圖像處理人員補掃。
8.4 數(shù)據(jù)檢驗
8.4.1 將裸數(shù)據(jù)進行驗收前的相應處理,包括文件的格式轉(zhuǎn)換、邏輯分盤處理、添加說明性文件。
8.4.2 對數(shù)據(jù)進行檢驗,給出合格或不合格結論。
8.4.3 將數(shù)字加工后的數(shù)據(jù)轉(zhuǎn)換為裸數(shù)據(jù)光盤格式,拷貝到活動硬盤上。
8.4.4 系統(tǒng)應自動記錄檢驗進度。
8.5 數(shù)據(jù)上載
檔案數(shù)字化各工序的數(shù)據(jù)通過網(wǎng)絡及時上載到數(shù)據(jù)服務器端匯總,其中數(shù)字圖像自動搜索對應的目錄數(shù)據(jù),加入對應的電子地址數(shù)字圖像文件名,建立起一一對應的關系。
8.6 數(shù)據(jù)備份
定期對服務器的各類數(shù)據(jù)進行備份,防止數(shù)據(jù)丟失。
9 信息存儲
以JPEG數(shù)字壓縮編碼或TIFF國際通用標準格式。采用國際標準的傳真文檔壓縮格式壓縮后,分別按頁編號后分頁存儲。
數(shù)字圖像的存儲管理應保持原紙質(zhì)檔案的保管模式對應存儲。
9.1 壓縮存儲格式
檔案數(shù)字圖像格式采用TIFF和JPEG數(shù)字壓縮編碼。
9.1.1 黑白二值圖像
黑白二值掃描圖像文件采用TIFF(CCITT G3)格式二值圖像壓縮算法,壓縮率就緒(Cr)為15:1。也可采用TIFF(CCIFF G4)格式二值圖像壓縮算法,壓縮率(Cr)為3 O:1。
9.1.2 連續(xù)色調(diào)靜態(tài)圖像
連續(xù)色調(diào)靜態(tài)圖像采用JPEG數(shù)字壓縮編碼,平均壓縮率(cr)為15:1。
9.2 編碼方式
應盡是采用實時操作性強的編碼方式。失真度編碼,用較少的比特率獲得較好的圖像質(zhì)量;無失真編碼,以低壓縮保持信息的不失真。一般情況下
宜采用國際通用編解碼算法。
9.3 存儲方式與載體
可選用在線和離線、不同載體進行存儲。
10 檢索利用
10.1 檢索利用方式
檔案數(shù)字圖像檢索利用可采用單機、局域網(wǎng)和互聯(lián)網(wǎng)三種方式。
局域網(wǎng)中傳輸利用,應保證數(shù)據(jù)在內(nèi)部局域網(wǎng)10Base?T帶寬下,平均1秒內(nèi)顯示響應完成?;ヂ?lián)網(wǎng)中傳輸利用,互聯(lián)網(wǎng)56Kbit/s帶寬下,平均5秒內(nèi)顯示響應完成。為此要求一般每頁檔案數(shù)字圖像的存儲容量為50K以內(nèi)。
10.2 檢索軟件配置
檢索軟件應符合國家檔案局制定的《檔案管理軟件功能要求暫行規(guī)定》的各項要求。檢索軟件應具備目錄檢索與檔案數(shù)字圖像方便調(diào)閱的基本功能。
紙質(zhì)檔案數(shù)字化有哪些基本要求
紙質(zhì)檔案是以紙張作為載體的一種檔案,如保存?zhèn)洳榈墓膱D紙、信札、電報、戶籍、帳冊、契約、證書、書稿、日記、筆記、家譜的原本和原稿。以下我為大家整理了紙質(zhì)檔案數(shù)字化有哪些基本要求的詳細內(nèi)容,希望對大家有所幫助!
紙質(zhì)檔案數(shù)字化基本要求
1、基本原則
紙質(zhì)檔案數(shù)字化的基本原則是使檔案信息資源準確方便快捷地提供利用,使可以公開的檔案信息資源得到共享,以滿足社會對檔案利用的需求。
2、數(shù)字化對像的確定原則
應當對所要進行數(shù)字化的對象按照一定的原則和方法進行確認,只有符合一定要求的紙質(zhì)檔案文獻才能進行數(shù)字化。
1)符合國家法律法規(guī)的原則
紙質(zhì)檔案的數(shù)字化,必須符合國家檔案開放規(guī)定以及有關規(guī)定。
2)價值性原則屬于歸檔范圍且應永久或長期保存的、社會利用價值高的'檔案可列入數(shù)字化加工的范圍。
3、基本環(huán)節(jié)
紙質(zhì)檔案數(shù)字化的基本環(huán)節(jié)主要包括:檔案整理、目錄建庫、檔案掃描、圖像處理、圖像存儲、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)驗收、數(shù)據(jù)備份、成果管理等。
檔案掃描
1、掃描方式
1)根據(jù)檔案幅面的大小(A4、A3、A0等)選擇相應規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可采用0號圖紙掃描儀)進行掃描。大幅面檔案可采用大幅面數(shù)碼平臺,或者縮微拍攝后的膠片數(shù)字化轉(zhuǎn)換設備等進行掃描,也可以采用小幅面掃描后的圖像拼接方式處理。
2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應采用平板掃描方式;紙張狀況好的檔案可采用高速掃描方式以提高工作效率。
2、掃描色彩模式
1)掃描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。
2)頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進行掃描。
3)頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可采用灰度模式掃描。
4)頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進行掃描。
3、掃描分辨率
1)掃描分辨率參數(shù)大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準。
2)采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般均建議選擇≥200dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。
3)需要進行OCR漢字識別的檔案,掃描分辨率建議選擇≥300dpi。
法律分析:檔案裝訂總體質(zhì)量要求1、 確保在掃描過程中不對檔案原件造成二次損傷。2、符合國家標準《紙質(zhì)檔案數(shù)字化技術規(guī)范》。3、保證檔案掃描圖像與原件-致、整潔、清晰。(一) 掃描加工要求1、掃描前應先對案卷進行預處理,啟釘、拆分,保證紙張的平整、撫平邊角。2、 采用最為可靠的掃描設備和掃描方式完成檔案掃描,避免紙張褶皺、撕裂、破損等情況,的發(fā)生。3、如遇到檔案紙張質(zhì)地脆弱,不適合反復拆裝訂的檔案,應采用不拆卷掃描設備和方式進行掃描。
法律依據(jù):《中華人民共和國標準化法》 第二條 本法所稱標準(含標準樣品),是指農(nóng)業(yè)、工業(yè)、服務業(yè)以及社會事業(yè)等領域需要統(tǒng)一的技術要求。
標準包括國家標準、行業(yè)標準、地方標準和團體標準、企業(yè)標準。國家標準分為強制性標準、推薦性標準,行業(yè)標準、地方標準是推薦性標準。
強制性標準必須執(zhí)行。國家鼓勵采用推薦性標準。
基建檔案圖紙掃描不用掃歸檔章。歸檔章是檔案管理專用章之一。歸檔章是印制于圖紙上表示鑒定、簽署或歸檔的文具。掃描時不需要掃描。