安全貿易

AnzenTrading Inc.

安全貿易有限会社

P1000525.JPG

| HOME | サービス |

当社の提供するサービスの中で、ブックスキャナの販売と印刷物のデジタル化サービスについて、当社の視点と考えを簡単にまとめてみました。

印刷物のデジタル化に関する 幾つかの視点

1)デジタル化と保存

デジタル化の結果得られるものは、アナログデータのデジタル変換による複製と、再利用の可能性の付与ではないでしょうか?  たとえば、家屋の建築に際し、紙媒体の図面が施主に渡されます。 建築事務所での保管は、せいぜい10年程度。 早い場合は数年で保管場所の制限から破棄されてしまいます。 保管は自己責任...となります。 木造家屋だけでなく、大規模住宅でも定期的なメンテナンスが施され、長期にわたり図面の管理が必要になります。 万が一、酸性紙の影響や、温度・湿度・虫食いなどや、原本自体が紛失してしまった場合、困難な状況が発生してしまいます。

同様に、企業の場合・・・  企業の本質は、Going Concern つまり、永続性にあります。 活動の記録は、企業だけの歴史にとどまらず、大げさに言えば人類の活動の歴史を構成する重要な資料ともなりえます。

そこで、選択肢のなかで、比較的最善に近い、デジタル化による複製の活用と、オリジナルの保存を実施することになります。 あくまで、オリジナルあっての、デジタル複製が価値を帯びてくるのです。

副次的に、デジタル化の恩恵は、頒布・バックアップの容易さに別のメリットを生み出すことにもなりました。 かつて、レコードからCDへ、そして、MP3へ音楽のフォーマットは急激に変わりました。
どのフォーマットが主流を占めるかではなく、選択肢のひとつとして、デジタルブック、eBookの存在があり、 これまでなかった使い方、効果も発生することにつながりました。 特に、MP3のもたらした変革は、大方の予想を大きく裏切り、今となっては主流の流通形態とその地位を高めました。

しかし、残念ながら デジタルデータの保存は、データが不可視であるゆえに、つまり、デジタルであるがゆえに、保存メディアの存続に左右されることになりました。そして、そのメディアの再生機にも左右されることになりました。 最近ではフロッピーでのデータ交換は少なくなりました。 フロッピー自体も5インチ、3.5インチと異なり、日本ではNEC98フォーマットとDOS/Vフォーマットで互換性に壁があり、CD-RやDVDの保存期間も、製品の質によってまちまちであることが既に判明しております。
どのフォーマットで保存しても、保存メディアが紙媒体ほど長期保存を経験したことがなく、メディアに対応する再生機も含めた保存が、デジタル保存には不可欠な状況であります。
一方、デジタル化のメリットは、複製の容易さと、保存の容易さ、物理的な容量などがあげられ、事実として、一度デジタル化してしまえば、ハードディスクや記録メディアの大容量化、高速化に対応することは、それほど困難ではありません。 むしろ、複数の複製を分散して保管することで万が一の対応策も範囲を広げています。

それゆえ、保存データは出来るだけ汎用性のあるフォーマットを選択し、少なくとも10年単位ではメディアの変換、フォーマットの変換に耐えられる準備もしなければなりません。
結局のところ、デジタル化による保存は、本当の意味での保存にはなりずらく、デジタル化によるメリットは、物理的な紙媒体の情報を保存・公開する技術的方法と捕らえるべきではないでしょうか?

つまり、情報は力と呼ぶにふさわしい、あらゆる情報を人類の資産として共有する手段として、大いに活用できる方法であると、位置づけることが可能であると思います。
米国のFootnote社(www.footnote.com
)が提供する、米国公文書館の貴重なデータをネットで公開するなど・・・これまで、現地に足を伸ばさなければ見ることが出来なかったデータも、パソコンの前で閲覧できる環境が手に入ります。

もっと、壮大な視点でみれば、情報公開は民主主義の基本。 あらゆる情報は公開されるベキものである・・・ 特に、行政・立法・裁判の資料は国民の資産として保存、管理、公開される事で、民主主義が磐石となるのでは・・・・  と言えなくもないのではないでしょうか。


2)デジタル化の本当の目的

4digitalbooks (仏) 販売価格、約5,000万円(推定)
Kirtas社(米) 販売価格 約2,400万円(推定)

本の大量スキャンをすることは、ただ単に「印刷物のデジタル化」ということだけにとどまらず、デジタル化した書類は、OCR(電子テキスト化)にかけることで、更に活用の範囲が広がるデジタル資産と変化する、ダイヤの原石を製造する作業でもあります。

スキャナは、あくまで道具であるが、OCRを前提にすれば、「文字認識し易い画像」を準備することが重要になります。 認識し易い画像を連続して、そして、大量に準備するには、スキャンする環境・条件を統一し、マイクロフィルムのような職人的な技を用いなくても、同質の画像をスキャンでき、長期に渡り、複数の人間が対処できる、コスト・時間を考慮した選択がポイントになってきます。
「認識しやすい画像」を大量スキャン書類で再現するには、照明、スキャン位置、角度、方法などを統一し、同じ条件で再現できる環境を実現することとも言えます。これこそが、ブックスキャナの提供するポイントであり、最大のメリットでもあります。

ところが、現在のOCRの精度が99%だとしても、400字原稿のなかで2、3文字の間違いが許容範囲かどうかは、判断を待たずとも明白です。 したがって、現状では、将来のOCRを見据えつつ、JPEG、TIFFやPDFに変換し、そのままでも可読状態に保持することも、次善の策と理解されております。

全自動と 手動スキャナ

実際のスキャン作業現場がネットなどで公開されているが、Kirtas社のスキャナを使用している画像を見ても、専用のオペレーターが付っきりで、また、ページめくりを手動で補助している様子を発見できますが、これをもって、全自動は大嘘と言うには早合点すぎるのでは?と思います。
例えが突飛かも知れませんが、フェラーリが数台買えてしまう高価な機械を、まったく無人で、ほったらかしで運用するなんて現実的には、ありえない相談では?と思います。
高性能な機械は、定期的なメンテ、校正、修理・・・そしてなによりも、プロのメンテ・サポートがないとすぐに大きな粗大ごみとなってしまうのです。 時として、本体価格よりも、メンテ費用の方が多くかかることは、いまや不思議ではありません。
いわば、Atiz社のスキャナは、光学部分の精密機械は日本製を使い、また、交換容易にすることで将来的なアップグレードも可能としました。  目指すところは、日本車の軽トラック。 安く、便利で、そして壊れずに、長期にわたり役に立つ。 しかし、自動車としての性能は高級車と比べることが無意味な上に、内装も簡素で、スピードも、乗り心地もあまりよくないかもしれません。 ただ、主目的がA地点からB地点への移動(アナログからデジタルへ移行)であるならば、荷物もたくさん積めて、確実に目的を達成してくれます。 むしろ、高級スポーツカーよりも、故障がすくなく、燃費もよく、長期にわたり役立つことが期待できます。

話がそれましたので、本のスキャンに戻りますと、本の状態は年代、サイズ、紙質、保存など・・・様々な要因で、性質が異なります。 理想的には機械に放り込んで、全自動でスキャンが完了となれば文句はありませんが、本を良く知るプロの声は別の方向で一致すようです。そもそも全自動はなにかあったらオッカナイ、とのことです。
実際、Kirtas社の製品を使用しても、スキャン条件、サイズなど、また、スキャン後の編集作業も含めれば、1時間あたり1000ページを現実的な速度としては難しいらしく、巷間ささやかれている情報として信頼のおける速度は、もっと小さい数が聞こえてきます。
全自動の意味は、結局、作業員・オペレーターの疲労具合を低減することによる、ミスの予防と言う側面が重要となるのではないでしょうか? なによりも、スキャニングの条件を整え、同じ品質の同じ状態のスキャンデータを、長期に大量に生産することが、全自動の最大のメリットであり、そこにスキャンの本質として評価されているポイントではないでしょうか?
Atiz社のBookDriveDIYは、ページめくり部分を手動にすることで、本のダメージや状態によった最適な対応を施し、全自動製品に引けをとらない、均質な状態の画像を準備することを可能とした製品です。

フラットベッドスキャナとの比較
複合機の一機能として提供されているものも含めると、ADF(オートドキュメントフィーダー)を備えた、ビジネスマシンの各オフィスへの導入は、かなり高い率で進んでおります。 フラットベッドスキャナの得意分野は、1枚1枚に分かれる、紙の四隅、端がしっかりしている状態の印刷物のスキャンがメインです。 一方、印刷物でも、製本されているもの、契約書のように、紙縒りや、ホッチキスでの紙綴じ書類は、一枚一枚手作業での紙面の調整が必要になり、少量のスキャン以外は、作業効率は非常に低いと言わざるをえません。 
本の背表紙をカットして、1枚1枚のページを切り離すことで、ADFでのスキャンも可能ですが、本を復元するには、再度、職人の技が必要となり、稀少本などには適応できません。
ADFでの高速スキャナは、その構造上、ホコリやゴミによる、縦スジの陰や色ムラなど
定期的なメンテ・掃除が不可欠であり、フィーダーと呼ばれる、紙の取り込みローラーによる紙詰まり、破損などと共に、両面、カラーや600dpi以上の高精度のスキャンとなると、スピードは極端に低下することは、もはや当たり前と認識すらされております。

増え続ける書類のデジタル化は、紙書類・製本・綴じ書類などの種類ごとに、適正なスキャナーを使うことで、効率・品質の高いデジタル化が可能となります。
万能なスキャナを目指すより、目的、用途によって、選択しの幅が広がることが これからの大量デジタル化には良い知らせとなるのではと、確信しております。