{"_id": {"$oid": "69d4eb12b877594bc5718895"}, "test_id": "T0121", "benchmark": "fraktur_adverts", "date": "2025-08-13", "tags": {"document-type": ["book-page"], "writing": ["printed"], "century": [18, 19], "language": ["de"], "layout": ["prose"], "script-style": ["fraktur"], "task": ["transcription"]}, "contributors": ["ina_serif", "maximilian_hindermann"], "hidden": false, "config": {"provider": "openai", "model": "gpt-5-mini", "dataclass": "Document", "temperature": 0.0, "role_description": "You are a historian with keyword knowledge", "prompt_file": "prompt_optimized.txt", "legacy_test": false}, "prompt": "## IDENTITY AND PURPOSE\n\nYou are an OCR and information extraction system trained to process historical newspaper pages printed in 18th-century German using Fraktur type. The pages contain mostly classified advertisements. Your task is to identify and extract each advertisement *exactly as printed*, including historical spellings, typographic errors, punctuation, and formatting.\n\n\n## INSTRUCTIONS\n\n- Extract **all advertisements** from the input image, one after the other, following the sequence on the page.\n- Maintain the **original spelling**, capitalization, and any **typos or non-standard forms**.\n- Follow these transcription rules: \n  - the long s (\u017f) is transcribed as \"s\"\n  - \"/\" is transcribed as \",\"\n- Use the masthead of the newspaper only to extract the date, ignore other content.\n- The layout is typically **two-column**; extract ads from both columns, including the ad number.\n- Return the result as a **JSON object** in the specified format and **nothing else** (no explanations, summaries, or additional text).\n- For each advertisement, include:\n  - `\"date\"`: the publication date of the page in ISO 8061 format (YYYY-MM-DD)\n  - `\"tags_section\"`: the heading under which the advertisement appears\n  - `\"text\"`: the full advertisement text\n\n## EXAMPLE OUTPUT\n\n{\n  \"advertisements\": [\n    {\n      \"date\": \"1731-01-02\",\n      \"tags_section\": \"Es werden zum Verkauff offeriert\",\n      \"text\": \"5. Ein kleines, jedoch listiges Lehrbuch der Zauberkunst, lange im Gebrauche des jungen Bartolomeus Simpson.\"\n    },\n    {\n      \"date\": \"1731-01-02\",\n      \"tags_section\": \"Es werden zum Verkauff offeriert\",\n      \"text\": \"6. Ein rarer, mit Edelsteinen besetzter Saxophon-Kasten, aus dem Besitze der Jungfer Lisa Simpson.\"\n    },\n    {\n      \"date\": \"1731-01-02\",\n      \"tags_section\": \"Es werden zu Entleihen begehrt\",\n      \"text\": \"7. Ein gar prachtvoller, jedoch etwas zerlesener Band mit Rezepten von Margaretha Simpsonin.\"\n    }\n  ]\n}\n", "results": {"provider": "openai", "model": "gpt-5-mini", "duration": 93.15597558021545, "timestamp": "2025-08-13T13:50:45.315938", "parsed": {"advertisements": [{"date": null, "tags_section": null, "ntokens": null, "text": "16. Bey Hrn. Rudolf Ramsperger an der Huthgass ist extra guter Holl\u00e4nder-Taback in blechernen Pfund-B\u00fcchsen \u00e0 10 Batzen, wie auch guter St. Vincent \u00e0 8 bis zu haben."}, {"date": null, "tags_section": null, "ntokens": null, "text": "17. Bey guter Art grosse Bohnen zum Sehen, eine kleine weisse dito zum Kochen in billigem Preis zu haben, ist im Berichtshaus ohne Entgelt zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "18. Zwey Barettein oder Professor-Huth, wie auch ein ganz neuer Castor-Huth, mittelm\u00e4\u00dfiger Gr\u00f6\u00dfe, im Berichtshaus zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "19. Bey Hrn. Burkhardt zum Riesen sind extra neue grosse Italienische Feigen, dito grosse Weintrauben mit und ohne Stiel, Haselnuss, dorne Mordchen, feiner Chocoladen, alles in billigem Preis zu haben."}, {"date": null, "tags_section": null, "ntokens": null, "text": "20. Zw\u00f6lf S\u00e4cke neuer Waizen in billigem Preis, im Berichtshaus ohne Entgelt zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "21. Bey Hrn. Jacob Grimm Buchbinder ist zu haben: 1) Ein Kriegs-Atlas von 6 theils Land-Karten, St\u00e4dten, Plans von Bataillen und Belagerungen des jetzigen Kriegs. 2) Die Welt in einer Nu\u00df mit Kupfern. 3) Die Durchlauchtigste Welt. 4) Saal mit Wappen. 5) Journal du Camp de Compiegne avec figures."}, {"date": null, "tags_section": null, "ntokens": null, "text": "22. Zwey saubere franz\u00f6sische Betten in ein Wirthshaus auf das Land oder in ein Bad dienlich, absonderlich im Berichtshaus zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "23. Eine Buchhandlung in der Els\u00e4sser Vorstadt mit 4 Stuben, 7 Kammern samt einer gro\u00dfen Werkstatt, Erbg und einem sch\u00f6nen gewohnten Acker und Garten, weshalb sich bey Hrn. Jacob Maglin dem Weinmann anzumelden."}, {"date": null, "tags_section": null, "ntokens": null, "text": "24. Ein Freund, welcher circa 600 Gester Hanf-Samen anhero liefern k\u00f6nnte, m\u00f6chte aber solchen vorher verkauft wissen, offerirt selbst dabey in billigem Preis, im Berichtshaus zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "25. Wo guter alter weisser Wein zu haben, ist bey Wsr. Michael Fuchs dem K\u00fcfer zu vernehmen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "26. Circa 6 Saum extra guter alter und rother P\u00f6ltiner-Wein, so gut als Neuburger oder Burgunder, in billigem Preis, im Berichtshaus zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "27. Zwey St\u00fccklein weissen Wein von 1760, 3 Pfund 10 \u00df der Saum im Kisten, und \u00e0 8 Pfund im andern, wovon nach Belieben zu haben, im Berichtshaus ohne Entgelt zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "28. Ein Stock Heu ab 2 Thannen Matten vor dem Riechterm Thor oberhalb der Schrockenbruck, ferner ein St\u00fccklein von 7 Saumen rothes Bollinger-Wein von 1760, schon roht und lauter, im Berichtshaus ohne Entgelt zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "29. Auf C. E. Gunt zum B\u00e4ren sind wiederum neue Saure R\u00fcben in billigem Preis zu haben."}, {"date": null, "tags_section": null, "ntokens": null, "text": "30. Ein roth Scharlachen Camisol und Hosen in billigem Preis, im Berichtshaus zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "31. Im Offenburgschen-Hof ist wohlverwahrter Bau zu haben."}, {"date": null, "tags_section": null, "ntokens": null, "text": "32. Ein Brennwaissh\u00e4uslein bey der Stitten-M\u00fchlin mit aller Kornmaligkeit, im Berichtshaus ohne Entgelt zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "33. Bey neuen rothen und weissen Burgunder wie auch Muscat-Wein, wegen Mangel Masse, wie auch rother und weisser 1759er Margrafer-Wein in billigem Preis zu haben, ist im Berichtshaus ohne Entgelt zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "34. Zeine heitgerglede Hamburger-Strick-Wollen das Pfund \u00e0 6 Pfund, wo dieselbe Pfundweiss zu haben, ist im Berichtshaus ohne Entgelt zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "35. Herrn Holzspeck bey Steigeis Behausung im Ziegelh\u00e4uslein mit 4 Stuben, 3 Kammern ist entweder zu verkaufen, oder s\u00e4mthaft zu vererben."}, {"date": null, "tags_section": null, "ntokens": null, "text": "36. Weisse und rothe Margrafer-Weine von 1760, wovon in billigem Preis nach Belieben zu haben, im Berichtshaus zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "37. Ein Mannbett in St. Peters Kirche auf dem Lechen. Item ein gr\u00fcn Tonnau-Bettlein mit gr\u00fcnen weissen Umh\u00e4ngen, in billigem Preis, im Berichtshaus zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "38. Ein Haus-K\u00fcchen mit einem sch\u00f6nen Bild und Zubeh\u00f6r in billigem Preis, im Berichtshaus zu erfragen."}, {"date": null, "tags_section": null, "ntokens": null, "text": "39. Der B\u00e4renfesser-Hof zu St. Peter, mit Garten, Stallung, Keller etc. wie der Augenschein zeigen wird. In Ermangelung eines K\u00e4ufers."}]}, "text": "", "finish_reason": "stop"}, "scoring": {"fuzzy": 0.65, "cer": 0.377}, "normalized_score": 62.3}