BLOB en PDF-compressie
In een MySQL-database voor een administratief systeem heb ik een InnoDB-tabel met een BLOB-veld voor documenten. Het merendeel van deze documenten (zo'n 80%) zijn PDF's. De overige documenten zijn typische Office-bestanden uit Word of Excel en incidenteel zit er een geëxporteerde e-mail of een foto bij.
Een aanzienlijk deel van de PDF's blijkt fors te kunnen worden gecomprimeerd, zonder verlies. In Adobe Acrobat Professional kom ik bijvoorbeeld regelmatig op een reductie van 100 kB tot 10 kB. Een universeel compressieformaat zoals ZIP haalt dat niet bij PDF, maar kan toch vele tientallen procenten schelen.
Welke workflow kunnen jullie me hier aanbevelen?
- ROW_FORMAT=COMPRESSED gebruiken en verder altijd de originelen opslaan?
- Een universeel compressieformaat zoals ZIP gebruiken?
- Een dedicated compressie inbouwen voor met name PDF naar PDF?
- Iets anders?
Een aanzienlijk deel van de PDF's blijkt fors te kunnen worden gecomprimeerd, zonder verlies. In Adobe Acrobat Professional kom ik bijvoorbeeld regelmatig op een reductie van 100 kB tot 10 kB. Een universeel compressieformaat zoals ZIP haalt dat niet bij PDF, maar kan toch vele tientallen procenten schelen.
Welke workflow kunnen jullie me hier aanbevelen?
- ROW_FORMAT=COMPRESSED gebruiken en verder altijd de originelen opslaan?
- Een universeel compressieformaat zoals ZIP gebruiken?
- Een dedicated compressie inbouwen voor met name PDF naar PDF?
- Iets anders?
PHP hulp
17/11/2024 01:17:51>> Een aanzienlijk deel van de PDF's blijkt fors te kunnen worden gecomprimeerd, zonder verlies. In Adobe Acrobat Professional kom ik bijvoorbeeld regelmatig op een reductie van 100 kB tot 10 kB.
Dat lijkt erop dat het gewoon platte tekst Pdf's zijn, en die zou je dus ook gewoon met een tekst editor kunnen openen. Niet zo'n beste PDF generator.
Dat lijkt erop dat het gewoon platte tekst Pdf's zijn, en die zou je dus ook gewoon met een tekst editor kunnen openen. Niet zo'n beste PDF generator.
Het zijn vaak facturen en creditnota's, dus één A4 met een logootje plus tekst. Die worden door een x-aantal partijen op een y-aantal manieren gefabriceerd, die inderdaad kennelijk niet allemaal optimaal zijn.
Snelheid van de oplossing is geen issue (het is overwegend een archief), maar in opslagruimte kan ik dus veel winnen. Suggesties?
Snelheid van de oplossing is geen issue (het is overwegend een archief), maar in opslagruimte kan ik dus veel winnen. Suggesties?
Ik zou een generieke compressie gebruiken.
Dus gewoon ZIP, dat kan iedereen uitpakken.
Ook de door Adobe Pro gegeneerde bestanden kunnen nog lichtelijk verkleind worden, omdat de XREF 'table' niet intern gecomprimeerd kan worden.
De compressie methode is overigens DEFLATE als ik het me goed herinner.
Dus gewoon ZIP, dat kan iedereen uitpakken.
Ook de door Adobe Pro gegeneerde bestanden kunnen nog lichtelijk verkleind worden, omdat de XREF 'table' niet intern gecomprimeerd kan worden.
De compressie methode is overigens DEFLATE als ik het me goed herinner.