Mater1984
Semiprofi
Thread Starter
- Mitglied seit
- 28.06.2024
- Beiträge
- 210
Hi zusammen,
Ich habe im Moment im Rahmen einer Stammbaum Erstellung das Problem, dass ich große PDF Dokumente (270 MB) vom National Archive habe.
Diese sind nicht transkribiert und enthalten große Mengen an Daten.
Z.B. Gefallene aus dem 2. WW. Mitgliederlisten der NSDAP usw.
Hier ein Beispiel: https://catalog.archives.gov/id/325638079?objectPage=2
Ich würde diese gerne Transkribieren um darin nach Namen und Daten suchen zu können.
Da mein Rechner sich so oder so 90% der Zeit langweilt dachte ich daran mit OCR, KI und einer lokalen Variante von Transkribus zu arbeiten.
Transkribus sollte als OpenSource verfügbar sein.
Hat einer von euch Erfahrung damit oder einen Ansatz?
Ich habe im Moment im Rahmen einer Stammbaum Erstellung das Problem, dass ich große PDF Dokumente (270 MB) vom National Archive habe.
Diese sind nicht transkribiert und enthalten große Mengen an Daten.
Z.B. Gefallene aus dem 2. WW. Mitgliederlisten der NSDAP usw.
Hier ein Beispiel: https://catalog.archives.gov/id/325638079?objectPage=2
Ich würde diese gerne Transkribieren um darin nach Namen und Daten suchen zu können.
Da mein Rechner sich so oder so 90% der Zeit langweilt dachte ich daran mit OCR, KI und einer lokalen Variante von Transkribus zu arbeiten.
Transkribus sollte als OpenSource verfügbar sein.
Hat einer von euch Erfahrung damit oder einen Ansatz?