{"id":689,"date":"2019-09-12T14:19:41","date_gmt":"2019-09-12T14:19:41","guid":{"rendered":"https:\/\/wiki.graven-ict.nl\/wordpress\/?p=689"},"modified":"2020-10-15T18:58:33","modified_gmt":"2020-10-15T18:58:33","slug":"een-gescande-pdf-naar-tekst","status":"publish","type":"post","link":"https:\/\/wiki.graven-ict.nl\/wordpress\/een-gescande-pdf-naar-tekst\/","title":{"rendered":"Een gescande PDF naar tekst"},"content":{"rendered":"\n<p>regelmatig kom je pdf documenten tegen waar de gescande tekst eigenlijk een plaatje is, dan is het niet mogelijk om de tekst te kopi\u00ebren, er zijn diverse tools te vinden op het internet maar op dit moment werk ik het liefst met ocrmypdf.<\/p>\n<ul>\n<li>ocrmypdf maakt <a href=\"https:\/\/nl.wikipedia.org\/wiki\/PDF\/A\">PDF\/A<\/a> documenten.<\/li>\n<li>De tekst word ook accurate op het image geplaats zodat het eenvoudig te copieren is.<\/li>\n<li>de resolutie van de plaatjes blijft gelijk.<\/li>\n<li>De documenten worden geoptimaliseerd meestal dus kleiner <\/li>\n<\/ul>\n<p>Op een ubuntu &gt; 18.04\u00a0 machine is het eenvoudige te installeren.<\/p><div id=\"grave-1502140783\" class=\"grave-content grave-entity-placement\"><script async src=\"\/\/pagead2.googlesyndication.com\/pagead\/js\/adsbygoogle.js?client=ca-pub-1970734611769428\" crossorigin=\"anonymous\"><\/script><ins class=\"adsbygoogle\" style=\"display:inline-block;width:728px;height:90px;\" \ndata-ad-client=\"ca-pub-1970734611769428\" \ndata-ad-slot=\"1820224830\"><\/ins> \n<script> \n(adsbygoogle = window.adsbygoogle || []).push({}); \n<\/script>\n<\/div>\n\n\n\n<pre>\nsudo apt install ocrmypdf \n<\/pre>\n\n\n\n<p>het gebruik van ocrmypdf is eenvoudig gewoon via de command line je geeft de input file en de output file naam op.\u00a0<\/p>\n<p>\u00a0<\/p>\n\n\n\n<pre>$ ocrmypdf input.pdf output.pdf\n<\/pre>\n","protected":false},"excerpt":{"rendered":"<p>regelmatig kom je pdf documenten tegen waar de gescande tekst eigenlijk een plaatje is, dan is het niet mogelijk om de tekst te kopi\u00ebren, er zijn diverse tools te vinden op het internet maar op dit moment werk ik het liefst met ocrmypdf. ocrmypdf maakt PDF\/A documenten. De tekst word ook accurate op het image ..<\/p>\n<div class=\"clear-fix\"><\/div>\n<p><a href=\"https:\/\/wiki.graven-ict.nl\/wordpress\/een-gescande-pdf-naar-tekst\/\" title=\"Meer lezen...\">Lees meer<\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[4],"tags":[],"class_list":["post-689","post","type-post","status-publish","format-standard","hentry","category-algemeen"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/posts\/689","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/comments?post=689"}],"version-history":[{"count":4,"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/posts\/689\/revisions"}],"predecessor-version":[{"id":693,"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/posts\/689\/revisions\/693"}],"wp:attachment":[{"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/media?parent=689"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/categories?post=689"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/wiki.graven-ict.nl\/wordpress\/wp-json\/wp\/v2\/tags?post=689"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}