ML4Print – Papierananlyse per künstlicher Intelligenz (KI)

Projektziele

Zielsetzung des ML4Print-Projektes ist die Entwicklung einer Software zur Automatisierten Forensischen Dokumenten- und Substratklassifizierung (Papiere). Hiermit soll die Klassifikation von Text- und Bilddokumenten im Hinblick auf verwendete Drucker und Papiere ermöglicht werden. Die Software wird anhand von konkreten Anwendungsszenarien, Dokumententypen und Drucktechnologien entwickelt, die in mehreren Vorgängerprojekten erarbeitet wurden.

Dem zukünftigen Anwender wird eine Software zur Verfügung stehen, mit der folgende Fragestellungen beantwortet werden können:

  • Wer war der Papierhersteller?
  • Welches Papierfabrikat wurde verwendet ?
  • Sind die Papiere aus der gleichen Charge ?
  • Mit welcher Drucktechnik und auf welchem Drucker wurde gedruckt ?
  • Sind alle Seiten auf dem gleichen Drucker und Papier gedruckt ?
  • Wurden einzelne Seiten verändert/manipuliert?

Ferner wird speziellen Benutzerngruppen (Dokumenten- und Schriftsachverständige, KTU, Kunsthandel, Bibliotheken) die Möglichkeit gegeben, eigene individuelle Referenzbibliotheken aufzubauen und so in ihre tägliche Arbeit zu integrieren.

Interesse einer der ersten Testnutzer zu werden – bitte kontaktieren Sie mich und bewerben Sie sich mit Ihrem Projekt!

Zur Rolle und den Aufgaben der Papieranalyse im ML4Printprojekt:

Zur softwarebasierten Analyse von Papieren, egal ob es nun Zeichnungen, Druckgrafiken, Bücher, Briefe etc. sind, werden Durchlichtaufnahmen von den entsprechenden Papierproben benötigt. Bei diesen erscheinen die Orte mit einer höheren flächenbezogenen Masse dunkler, die mit einer kleineren Masse heller. Neben zumeist unregelmäßigen Strukturen gibt es eine wesentlich feinere, regelmäßige, die von dem/n Papiermaschinensieb/en, Filzen, Walzen etc. her stammen. Markierungen werden in das Papier zumeist vom Papiermaschinensieb eingebracht. Hier können aber auch Egoutteur und Egoutteurgrundgewebe, Filzgrundgewebe, Trockensiebe, Saugwalzen und weitere Entwässerungswalzen entsprechende Verursacher sein. Neben diesen direkten – also jenen, den ein eindeutiges strukturgebendes Element zugeordnet werden kann – können auch indirekte Markierungen auftreten, wie beispielsweise eine vom Stoffauflauf verursachte (Längs-) Streifigkeit, eine durch Walzen- oder Gewebeschwingungen regelmäßige Querstreifigkeit, Unregelmäßigkeiten durch Pulsationen von Stoffpumpen etc.. Mittels FFT können dabei spezielle Markierungen eines bestimmten Verursachers herausgefiltert, klassifiziert und sichtbar gemacht werden. Für die Umsetzung mittels Bild­analyse detektierter Papierstrukturen in Zeiträume der Papierherstellung werden neben der Auswertung und dem Abgleich mit technisch typischen Strukturen auch eine umfangreiche Substratreferenzbibliothek (Papiermaschinen und –herstellern zugeschriebene und datierte Papierproben als Referenzen) und ein umfangreiches papierhistorisches Wissen benötigt.Neben den regelmäßigen sind die unregelmäßigen Strukturen (Wolkigkeit, Faserverteilung, Faser­orientierung etc.) im Papier wesentliche Merkmale der Substrate, die zum Vergleich der Papiere herangezogen werden können. Im Projekt „Papier – unde venis“ konnte nachgewiesen werden, dass sich für den Vergleich von Papieren bereits sehr gut eignet. Um die Treffsicherheit schon entwickelter und erprobter Software bei der Bestimmung von identischen Papieren weiter zu erhöhen, ist es notwendig, weitere Vergleichsmerkmale zu detektieren. Mittels KI-Ansatz sollen weitere Vergleichsmerkmale detektiert werden. Mittels SaliencyMaps und GradCAM lässt sich dann jeweils nach einem Trainingslauf überprüfen, welche Bereiche der Patches für die Klassifizierung von Relevanz sind. Diese Information kann dann wieder in die Anpassung der Probengröße einfließen.

Projektlaufzeit:

1.3.2022 bis 29.2.2024

Projektpartner:

Förderkennzeichen: 01IS22008B | Zuwendung aus dem Bundeshaushalt, Einzelplan 30, Kap.04, Titel 68321, Haushaltsjahr 2022 | Vorhaben: „KMU-innovativ – Verbundprojekt ML4Print: Automatisierte Forensische Dokumenten- und Substratklassifizierung“