pdf -> txt/html door middel van php
Hoi iedereen,
ik ben bezig om op mijn site een zoekmachine te maken die in pdf bestanden kan doorzoeken. dit doe ik door pdf bestanden te veranderen in plain text. Alleen lukt dit niet..
ik heb een paar van deze geprobeerd: http://nl2.php.net/manual/en/ref.pdf.php alleen lukt het niet. ik krijg of errors te zien of helemaal niets.
ik moet een php script vinden dus kom niet met pdftk :P
ik ben bezig om op mijn site een zoekmachine te maken die in pdf bestanden kan doorzoeken. dit doe ik door pdf bestanden te veranderen in plain text. Alleen lukt dit niet..
ik heb een paar van deze geprobeerd: http://nl2.php.net/manual/en/ref.pdf.php alleen lukt het niet. ik krijg of errors te zien of helemaal niets.
ik moet een php script vinden dus kom niet met pdftk :P
Code (php)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
<?
$file = "test.pdf";
$outpath = preg_replace("/\.pdf$/", "", $file).".txt";
system("pdftotext ".escapeshellcmd($file), $ret);
if ($ret == 0)
{
$value = file_get_contents($outpath);
unlink($outpath);
print $value;
}
if ($ret == 127)
print "Could not find pdftotext tool.";
if ($ret == 1)
print "Could not find pdf file.";
?>
$file = "test.pdf";
$outpath = preg_replace("/\.pdf$/", "", $file).".txt";
system("pdftotext ".escapeshellcmd($file), $ret);
if ($ret == 0)
{
$value = file_get_contents($outpath);
unlink($outpath);
print $value;
}
if ($ret == 127)
print "Could not find pdftotext tool.";
if ($ret == 1)
print "Could not find pdf file.";
?>
Stond bij de reacties...
Misschien kan je iets met deze pagina:
http://lists.evolt.org/archive/Week-of-Mon-20060918/185175.html
http://lists.evolt.org/archive/Week-of-Mon-20060918/185175.html