{"id":37,"date":"2017-05-23T21:51:15","date_gmt":"2017-05-23T19:51:15","guid":{"rendered":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/?p=37"},"modified":"2017-09-05T09:15:30","modified_gmt":"2017-09-05T07:15:30","slug":"ocropus-installation","status":"publish","type":"post","link":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/2017\/05\/ocropus-installation\/","title":{"rendered":"OCRopus &#8211; Installation"},"content":{"rendered":"<p>Um OCRopus zu Installieren ben\u00f6tigt man drei Dinge: Ein Linuxsystem, OCRopus und eine Pythonumgebung mit den abh\u00e4ngigen Paketen.<\/p>\n<p><strong>Linux<\/strong><\/p>\n<p>Wenn man als Betriebssystem Windows oder Mac OS nutzt, ist es etwas unverh\u00e4ltnism\u00e4\u00dfig, allein wegen OCRopus Linux als Zweit- oder sogar Hauptsystem zu installieren. Am besten ist die Verwendung einer <a href=\"https:\/\/www.virtualbox.org\/\">VirtualBox <\/a>und des Linux-Derivats <a href=\"https:\/\/www.ubuntu.com\/\">Ubuntu<\/a>. Somit muss man nicht die ganze Festplattenpartitionierung umbauen und kann sich in einem gesch\u00fctzten Raum austoben. Das Einrichten einer virtuellen Maschine wird <a href=\"https:\/\/blogs.urz.uni-halle.de\/strickdings\/2017\/05\/virtualbox\/\">hier <\/a>erkl\u00e4rt.<\/p>\n<p><strong>OCRopus<\/strong><\/p>\n<p>Am besten man erstellt sich in seinem Home-Verzeichnis einen Ordner <em>build<\/em> und speichert das Paket darin. OCRopus kann man sich <a href=\"https:\/\/github.com\/tmbdev\/ocropy\">hier <\/a>von GitHub laden und dann einfach im Ordner <em>build<\/em> entpacken.<\/p>\n<div style=\"width: 530px;\" class=\"wp-video\"><!--[if lt IE 9]><script>document.createElement('video');<\/script><![endif]-->\n<video class=\"wp-video-shortcode\" id=\"video-37-1\" width=\"530\" height=\"209\" preload=\"metadata\" controls=\"controls\"><source type=\"video\/mp4\" src=\"https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/ocropus_download_zip.mp4?_=1\" \/><a href=\"https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/ocropus_download_zip.mp4\">https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/ocropus_download_zip.mp4<\/a><\/video><\/div>\n<p><strong>Python-Umgebung<\/strong><\/p>\n<p>Ocropus nutzt Python 2.7 und ist abh\u00e4ngig von den Paketen scipy, matplotlib und\u00a0 lxml. In der Dokumentation wird auch noch numpy und pil erw\u00e4hnt, deswegen habe ich die beiden Pakete in die PACKAGES-Datei mit hineingeschrieben.<\/p>\n<div style=\"width: 530px;\" class=\"wp-video\"><video class=\"wp-video-shortcode\" id=\"video-37-2\" width=\"530\" height=\"318\" preload=\"metadata\" controls=\"controls\"><source type=\"video\/mp4\" src=\"https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/PACKAGES.mp4?_=2\" \/><a href=\"https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/PACKAGES.mp4\">https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/PACKAGES.mp4<\/a><\/video><\/div>\n<p>Jetzt kann man mit strg+alt+t die Konsole \u00f6ffnen und zum Ocropus-Ordner navigieren. Mit<\/p>\n<pre><code>cd build\/ocropy-master\/<\/code><\/pre>\n<p>wechselt man in das Verzeichnis. Man kann die Tabulatortaste benutzen um Verzeichnisnamen automatisch zu vervollst\u00e4ndigen. Im Verzeichnis angekommen, folgt man den <a href=\"https:\/\/github.com\/tmbdev\/ocropy\">Installationsanordnungen<\/a>, also<\/p>\n<pre><code>sudo apt-get install $(cat PACKAGES)<\/code><\/pre>\n<p>Damit werden die Pakete installiert, die wir vorher in der PACKAGES-Datei geschrieben haben. Die Liste ist vielleicht etwas l\u00e4nger, da auch alle abh\u00e4ngigen Pakete gezogen werden.<\/p>\n<p>Jetzt holt man sich noch zwei Erkennungsmodelle, eins f\u00fcr normale Schrift und eins f\u00fcr Fraktur:<\/p>\n<pre><code>wget -nd http:\/\/www.tmbdev.net\/en-default.pyrnn.gz\r\nwget -nd http:\/\/tmbdev.net\/ocropy\/fraktur.pyrnn.gz\r\n<\/code><\/pre>\n<p>Und verschiebt sie in das Verzeichnis <em>models\/<\/em><\/p>\n<pre><code>mv en-default.pyrnn.gz fraktur.pyrnn.gz models\/<\/code><\/pre>\n<p>Jetzt kann man OCRopus installieren.<\/p>\n<pre><code>python setup.py install<\/code><\/pre>\n<p>Die Erkennungsmodelle aus dem Ordner<em> ~\/build\/ocropus-master\/models\/<\/em> (die ~ meint das Home-Verzeichnis) werden bei der Installation nach <em>\/usr\/local\/share\/ocropus\/<\/em> kopiert. Entweder man kopiert neue Modelle gleich dahin oder speichert sie im <em>~\/build\/ocropus-master\/models\/<\/em> und f\u00fchrt das Setup wieder durch. Dabei wird dann alles neu geschrieben.<\/p>\n<p>Um zu testen, ob alles geklappt hat, kann man den run-test durchf\u00fchren:<\/p>\n<pre><code>.\/run-test<\/code><\/pre>\n<div style=\"width: 530px;\" class=\"wp-video\"><video class=\"wp-video-shortcode\" id=\"video-37-3\" width=\"530\" height=\"318\" preload=\"metadata\" controls=\"controls\"><source type=\"video\/mp4\" src=\"https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/ocropus-installation.mp4?_=3\" \/><a href=\"https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/ocropus-installation.mp4\">https:\/\/blogs.urz.uni-halle.de\/strickdings\/files\/2017\/05\/ocropus-installation.mp4<\/a><\/video><\/div>\n<p>Wenn die Warnung von matplotlib st\u00f6rt, kann man diese zwei Befehle ausprobieren:<\/p>\n<pre><code>sudo rm -rf ~\/.cache\/fontconfig\r\nsudo rm -rf ~\/.cache\/matplotlib\r\n\r\n<\/code><\/pre>\n","protected":false},"excerpt":{"rendered":"<p>Hier wird die Installation von OCRopus und seiner abh\u00e4ngigen Pakete beschrieben und wie man sich zwei Erkennungsmodelle implementiert. <a class=\"more-link\" href=\"https:\/\/blogs.urz.uni-halle.de\/strickdings\/2017\/05\/ocropus-installation\/\">weiterlesen  <span class=\"screen-reader-text\">  OCRopus &#8211; Installation<\/span><span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":241,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[4],"tags":[2,3,6,5],"_links":{"self":[{"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/posts\/37"}],"collection":[{"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/users\/241"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/comments?post=37"}],"version-history":[{"count":9,"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/posts\/37\/revisions"}],"predecessor-version":[{"id":95,"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/posts\/37\/revisions\/95"}],"wp:attachment":[{"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/media?parent=37"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/categories?post=37"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.urz.uni-halle.de\/strickdings\/wp-json\/wp\/v2\/tags?post=37"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}