{"_id": {"$oid": "69d4eb12b877594bc57188e0"}, "test_id": "T0177", "benchmark": "fraktur_adverts", "date": "2025-09-26", "tags": {"document-type": ["book-page"], "writing": ["printed"], "century": [18, 19], "language": ["de"], "layout": ["prose"], "script-style": ["fraktur"], "task": ["transcription"]}, "contributors": ["ina_serif", "maximilian_hindermann"], "hidden": false, "config": {"provider": "mistral", "model": "mistral-medium-2508", "dataclass": "Document", "temperature": 0.0, "role_description": "You are a historian with keyword knowledge", "prompt_file": "prompt_optimized.txt", "legacy_test": false}, "prompt": "## IDENTITY AND PURPOSE\n\nYou are an OCR and information extraction system trained to process historical newspaper pages printed in 18th-century German using Fraktur type. The pages contain mostly classified advertisements. Your task is to identify and extract each advertisement *exactly as printed*, including historical spellings, typographic errors, punctuation, and formatting.\n\n\n## INSTRUCTIONS\n\n- Extract **all advertisements** from the input image, one after the other, following the sequence on the page.\n- Maintain the **original spelling**, capitalization, and any **typos or non-standard forms**.\n- Follow these transcription rules: \n  - the long s (\u017f) is transcribed as \"s\"\n  - \"/\" is transcribed as \",\"\n- Use the masthead of the newspaper only to extract the date, ignore other content.\n- The layout is typically **two-column**; extract ads from both columns, including the ad number.\n- Return the result as a **JSON object** in the specified format and **nothing else** (no explanations, summaries, or additional text).\n- For each advertisement, include:\n  - `\"date\"`: the publication date of the page in ISO 8061 format (YYYY-MM-DD)\n  - `\"tags_section\"`: the heading under which the advertisement appears\n  - `\"text\"`: the full advertisement text\n\n## EXAMPLE OUTPUT\n\n{\n  \"advertisements\": [\n    {\n      \"date\": \"1731-01-02\",\n      \"tags_section\": \"Es werden zum Verkauff offeriert\",\n      \"text\": \"5. Ein kleines, jedoch listiges Lehrbuch der Zauberkunst, lange im Gebrauche des jungen Bartolomeus Simpson.\"\n    },\n    {\n      \"date\": \"1731-01-02\",\n      \"tags_section\": \"Es werden zum Verkauff offeriert\",\n      \"text\": \"6. Ein rarer, mit Edelsteinen besetzter Saxophon-Kasten, aus dem Besitze der Jungfer Lisa Simpson.\"\n    },\n    {\n      \"date\": \"1731-01-02\",\n      \"tags_section\": \"Es werden zu Entleihen begehrt\",\n      \"text\": \"7. Ein gar prachtvoller, jedoch etwas zerlesener Band mit Rezepten von Margaretha Simpsonin.\"\n    }\n  ]\n}\n", "results": {"provider": "mistral", "model": "mistral-medium-2508", "duration": 52.24450755119324, "timestamp": "2025-09-26T09:03:13.019958", "parsed": {"advertisements": [{"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "1. Ein St\u00fcfflein von circa 20. Saum extra sch\u00f6n und guter Monagor = Wein von anno 1728. in ausloblicher Prei\u00df."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "2. Das W\u00fcrthshau\u00df zur Lannen allhier, samt Bethw\u00e4rck, allaugiger Geschirr und Hau\u00dfrath, auch all \u00fcbrige Berechtigung in b\u00e4ulicher Prei\u00df, und finden die Herren Liebhaber in dem Adelichen Contoir Beschied."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "3. Ein Stuck Heu von ohnges\u00e4et, W\u00e4gen von leister Recche, sehr gut und obnebr\u00e4nt, in rationablen Prei\u00df zu haben."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "4. Ein sehr sch\u00f6nes und wohl erhaltenes Margatze, mit 2. guten Pferden, und von besten Orth in modernem Prei\u00df."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "5. Ein zimlich wohl conditionirte Violino di Gamba, fo im Adelichen Contoir zu haben."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "6. Drey gute Mu\u00dfcateller und Languedocer = Wein der Boutelle \u00e0 7 1/2 B\u00e4tzen."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "7. Ein grosser Bundel, daran drey Personen zugleich sitzen und dreyhen R\u00e4then, samt beyder gestirnter und vergulderter Armaturen, fo im Adelichen Contoir zu sehen."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "8. Ein grosser Bundel, daran drey Personen zugleich sitzen und dreyhen R\u00e4then, samt beyder gestirnter und vergulderter Armaturen, fo im Adelichen Contoir zu sehen."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "9. Ein sch\u00f6ner Bundel, samt einem Beschied."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "10. Ein extra sch\u00f6ner Bier, Schlitt."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "11. Ein halb-Dutzent Franz\u00f6sischer Sessel von gr\u00fcnen Moquett, so wohl in Adelicher Contoir zu sehen."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "12. F\u00fcnf Stuck Tapetzerey von rother Moquette, so wohl in Adelicher Contoir zu sehen."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "13. Ein sehr guter und wohl erhaltenes Clavier, auf die neue Mode."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "14. Ein sehr guter und wohl erhaltenes Clavier, auf die neue Mode."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "15. Ein sehr guter und wohl erhaltenes Clavier, auf die neue Mode."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "16. Ein sehr guter und wohl erhaltenes Clavier, auf die neue Mode."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "17. Ein sehr guter und wohl erhaltenes Clavier, auf die neue Mode."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "18. Ein sehr guter und wohl erhaltenes Clavier, auf die neue Mode."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "19. Ein mit Silber garnirte g\u00fcldene Canne naturell."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "20. Zwey kleine B\u00e4rn, fo\u00dflein per J\u00fcngsteinn."}, {"date": "1731-01-02", "tags_section": "Es werden zum Verkauff offeriert", "ntokens": null, "text": "21. Saubere Limmet, D\u00e4chten zum Rojenkranz."}, {"date": "1731-01-02", "tags_section": "Es werden zu entleihen begehrt", "ntokens": null, "text": "1. Ein Gulden der Zentner."}, {"date": "1731-01-02", "tags_section": "Es werden zu entleihen begehrt", "ntokens": null, "text": "2. Ein Englischer Sattel, fast neu, samt andern Pferderzeug und Steigb\u00fcgel."}, {"date": "1731-01-02", "tags_section": "Es werden zu entleihen begehrt", "ntokens": null, "text": "3. Saubere Zimmet und Pistolenn."}, {"date": "1731-01-02", "tags_section": "Es werden zu kaufen begehrt", "ntokens": null, "text": "1. Emanuel von Mettern oder Metternich Niederl\u00e4ndische bische Geschichter, Teutsch und Hollandisch, gang oder defekt, und offerirt man, wann es anst\u00e4ndig offeriert wird, was b\u00fcchlich."}, {"date": "1731-01-02", "tags_section": "Es wird zum Austrocknen offeriert", "ntokens": null, "text": "1. Ein Capital von 100. Pfunden auf anst\u00e4ndige Sicherheit."}, {"date": "1731-01-02", "tags_section": "Es wird zum Austrocknen offeriert", "ntokens": null, "text": "2. Ein Capital von 500. Pfunden auf gute Sicherheit, in der Stadt."}, {"date": "1731-01-02", "tags_section": "Es wird zum Austrocknen offeriert", "ntokens": null, "text": "3. Die Schmiede, Bewohnung und Stallung um die Miethe, wie es vorige Werckstatt."}, {"date": "1731-01-02", "tags_section": "Es wird zum Austrocknen offeriert", "ntokens": null, "text": "4. Ein sehr guter und wohl erhaltenes Clavier, auf die neue Mode."}, {"date": "1731-01-02", "tags_section": "Hingegen wird zu entleihen begehrt", "ntokens": null, "text": "1. Ein sehr sch\u00f6ner Mann in einer benachbarten Herrschaft begehrt ein Capital von 100. Gulden und anst\u00e4ndige Interesse Unterpf\u00e4nder und offeriert daf\u00fcr confiderable B\u00fcrgschafft, so man verlanget, bisige Wochentage zu geben."}, {"date": "1731-01-02", "tags_section": "Hingegen wird zu entleihen begehrt", "ntokens": null, "text": "2. Verlangender Sommer hat ein Freund in dem andern Viser-Stadt von dreyen St\u00fccken braunen Br\u00e4ffilischer Holtz mit W\u00e4chingen garniert, fo 180. Thaler werth, dabero er biemlich gang fr\u00fcndlich umb die Restitution will gebethen haben."}, {"date": "1731-01-02", "tags_section": "Hingegen wird zu entleihen begehrt", "ntokens": null, "text": "3. Sambstages den 31. December j\u00fcngsthin des Morgens fr\u00fche bey dem hellen Mondscheine ist auff der Neyenbr\u00fcck gefunden worden: Ein silbernes B\u00fcrschafft, die Perlen, fo felbige verbinden, betragen an Gewicht 12. Loth, dem Spazierg\u00e4nger, so die\u00dfes an sich nehmen, und in hinteren Paraffien zu entdecken."}, {"date": "1731-01-02", "tags_section": "Hingegen wird zu entleihen begehrt", "ntokens": null, "text": "4. Schon vor etwass Zeit vernamblich leisten Sommer ist ein kleinen Mann von M\u00fctzen in offenes Wiertshaus in der Schleyffen mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen, so mit einem kleinen Schleyffen."}]}, "text": "", "finish_reason": "stop"}, "scoring": {"fuzzy": 0.404, "cer": 0.66}, "normalized_score": 34.0}