Slovensko sodstvo zapisnik obravnave že desetletja vodi po ustaljenem postopku: zapisnikar med obravnavo sliši izrečeno, povzame ali dobesedno zapiše in zapisnik na koncu podpiše skupaj s sodnikom. Ta postopek je preverjen, a počasen — in v zadnjih letih vse težje vzdržen, ker se obseg sodnih zadev povečuje, kadra za zapisnikarstvo pa primanjkuje. Truebar TB-Podnaslavljalnik je v slovenskem sodstvu v rabi v 19 sodnih dvoranah, kjer obravnavo v realnem času prepiše neposredno na zaslon. V tem zapisu povzamemo, kako sistem deluje, kaj smo se v praksi naučili in kakšne so možnosti razširitve na druge dele pravosodja.
Trenutna praksa in njeni izzivi
Zapisnik obravnave v slovenskih sodiščih je v praksi delo zapisnikarja, ki ob sodniku in strankah piše ali tipka, kar sliši. Pri tem mora ohraniti dokazno vrednost, zato povzemanje pogosto kombinira z dobesednim zapisom ključnih izjav, ugovorov in odgovorov. Pri zahtevnih kazenskih ali pravdnih zadevah s več strankami in pričami se na koncu dneva nabere več deset strani zapisnika.
V praksi se pojavljajo trije ponavljajoči se izzivi:
Hitrost in obseg. Zapisnikar v daljši obravnavi ne more dobesedno zajeti vsega; nujno povzema. Kasneje pri pritožbah, kjer se sklicuje na natančno izjavo, je tega včasih premalo.
Več govorcev hkrati. Pri pravdah s številnimi strankami se govorci občasno prekrivajo. Tudi z disciplino predsednika senata je določen del izrečenega težko enoznačno pripisati posamezni osebi.
Pravna terminologija. Sodne obravnave so polne formalnih izrazov ("po uradni dolžnosti", "vlagam ugovor", "predlagam zaslišanje priče"), pravnih institutov, številk zakonov, datumov in šifer zadev. Splošen sistem za razpoznavo govora pogosto pogreši prav ta del, ki je za zapisnik najpomembnejši.
Kako deluje TB-Podnaslavljalnik v sodni dvorani
TB-Podnaslavljalnik je naša rešitev za podnaslavljanje in transkripcijo v živo. V sodni dvorani je nameščen tako, da preko mikrofonov zajame govorce, zvok pretočno pošlje v razpoznavo govora in pretipkan tekst sproti prikazuje na zaslonu sodne dvorane ali v aplikaciji zapisnikarja. Latenca je sub-sekundna, kar pomeni, da besedilo nastaja praktično hkrati z izrečenim.
Pristop ima dve pomembni značilnosti.
Prvič, sistem ne nadomešča zapisnikarja, temveč ga okrepi. Zapisnikar med obravnavo besedilo spremlja, sproti popravlja morebitne napake in dopolnjuje vsebinske oznake (kdo govori, kakšen je status izjave). Surovi pretočni prepis je torej delovni dokument, ne končni zapisnik.
Drugič, uporabljamo namenski pravni jezikovni model. Truebar v sodnih dvoranah teče s slovarjem, ki vključuje slovensko pravno izrazoslovje, formalne fraze, številke najpogosteje rabljenih zakonov in tipične izjave strank. Razpoznava številke zakona, naziva pravnega instituta ali tipičnega ugovora je bistveno natančnejša kot pri splošnem modelu.
Pravni vidik: dokazna vrednost in odgovornost
Strojni prepis sam po sebi nima dokazne vrednosti zapisnika. Slovenski procesni predpisi zahtevajo, da zapisnik podpišejo sodnik in zapisnikar (oziroma stranke, kadar je to potrebno), in da je vsebina overjena z njihovim podpisom. TB-Podnaslavljalnik je v tem kontekstu pripomoček — orodje, ki pospeši nastanek zapisnika, ne pa pravno relevanten dokument sam zase.
V praksi to pomeni, da je tok dela tak: pretočna razpoznava → sprotno popravljanje pri zapisnikarju → urejen osnutek zapisnika ob koncu obravnave → pregled, popravki, podpis. V tem zaporedju človek vedno ostane v zanki, sistem pa odpravi mehansko prepisovanje, ki je najbolj utrudljiv del.
Za hrambo posnetkov in prepisov ostajajo v veljavi splošni postopki sodne uprave, vključno z roki hrambe in pravicami strank do vpogleda. Za podrobnejše informacije o rešitvi za sodno okolje je na voljo razdelek Sodstvo.
Kaj smo se naučili iz 19 dvoran
Razširitev sistema čez 19 sodnih dvoran je pokazala nekaj vzorcev, ki niso bili samoumevni v prvih prototipih.
Mikrofonska postavitev je pol uspeha. Najpomembnejša razlika v natančnosti ne izvira iz modela, temveč iz tega, kako je zvok zajet. Sodne dvorane z usmerjenimi mikrofoni za vsako mesto (sodnik, stranki, priča) dosegajo znatno boljše prepise od dvoran s skupnim ambientalnim mikrofonom. Pri novih namestitvah na ta del namenimo bistveno več pozornosti.
Latenca je vidna in pomembna. V sodni dvorani je zaslon, na katerem se izrečeno besedilo pojavlja z zamudo več kot ene sekunde, moteč: udeleženci čakajo, kdaj se bo izpisalo, kar so povedali, ali jih to celo zavre v izražanju. Sub-sekundni odziv, ki ga zagotavlja TB-Podnaslavljalnik, je tukaj ključen.
Sprotno popravljanje deluje. Zapisnikar v vsaki obravnavi popravi del besedila — in te popravki, anonimizirani in pregledani, postopno izboljšujejo lokalni slovar. Po nekaj mesecih uporabe v isti dvorani so napake pri imenih, krajevnih oznakah in pogostih izrazih bistveno redkejše.
Integracija s sodno upravo je inkrementalna. Začeli smo z najpreprostejšo postavitvijo — TB-Podnaslavljalnik kot samostojna aplikacija, ki proizvede DOCX ali PDF na koncu obravnave. Šele po prvih izkušnjah smo se v sodelovanju s sodišči lotili tesnejše povezave z obstoječim informacijskim sistemom za vodenje zadev.
Zaupanje se gradi postopno. V prvih tednih je vsak nov sodnik in zapisnikar do strojnega prepisa upravičeno skeptičen. Po nekaj uspešno izvedenih obravnavah, kjer se je sistem izkazal kot zanesljiv pripomoček, se skepsa praviloma umakne. To je dolgoročno najpomembnejši dejavnik uspeha — tehnologija mora biti najprej preprosto uporabna in zanesljiva, šele nato napredna.
Diarizacija: kako natančno ločimo govorce
V sodni obravnavi je pomembno ne le, kaj je bilo rečeno, temveč tudi, kdo je to izrekel. Tu pride v poštev diarizacija govorcev — samodejno ločevanje audio toka po posameznih osebah.
V dvoranah z usmerjenimi mikrofoni za vsako mesto je pripisovanje govorca trivialno: mikrofon je vezan na osebo. Pri ambientalnem zajemu pa diarizacija primerja akustične značilnosti glasu in zaporedje izjav pripiše posameznim govorcem. V praksi sistem v slovenskem okolju zanesljivo loči med tremi do petimi različnimi govorci v isti seji; pri obravnavah z desetimi in več govorci je natančnost odvisna od kakovosti zvoka.
Kombinacija usmerjenih mikrofonov in diarizacije v sistemu (kot redundance) je v praksi najzanesljivejša postavitev.
Možnosti razširitve
Sodne dvorane so naravno izhodišče, ne pa edini segment, v katerem ima sistem smisel.
Državna in okrožna tožilstva vodijo zaslišanja, kjer je dokumentacija pogosto bolj formalna kot v civilnih obravnavah, izziv s terminologijo in več govorci pa enak. Pretočna razpoznava in podnaslavljanje za interno uporabo lahko bistveno skrajšata pripravo zapisnika.
Odvetniške pisarne prepise potrebujejo za izjave strank, posvete in interne pripravljalne sestanke. Za to je pogosto primerneje uporabiti spletni TB-Urejevalnik, ki sprejme posnetek in vrne urejen prepis z govorci.
Notarji beležijo izjave strank, kjer je natančnost dobesednega zapisa zakonska zahteva. TB-Podnaslavljalnik se v tem kontekstu uporablja kot orodje za izdelavo osnutka, ki ga notar nato natančno pregleda in overi.
Vse tri rešitve uporabljajo isto tehnološko jedro — razliko delajo namenski slovarji, integracija z obstoječim sistemom in postopek dela, ki se mu sistem mora prilagoditi.
Pogosta vprašanja
Kakšna je natančnost prepisa?
Pri jasno zajetem zvoku v sodni dvorani in v slovenskem jeziku Truebar dosega visoko natančnost, primerljivo s pripravljenim človeškim prepisovalcem. Konkreten odstotek je odvisen od mikrofonske postavitve, števila govorcev in zahtevnosti vsebine; za odgovorno oceno priporočamo pilotni preizkus v vaši konkretni dvorani.
Kako se z besedo "ugovor" ali drugimi formalnimi izrazi ravna?
Pravni jezikovni model je naučen na obsežnem korpusu slovenskih sodnih obravnav in pravnih besedil. Pogoste formalne fraze ("vlagam ugovor", "umikam predlog", "predlagam zaslišanje priče", "vlagam pritožbo") so prepoznane praviloma brezhibno, vključno z velikimi začetnicami in ločili tam, kjer so v zapisniku običajna.
Lahko se uporabnik pridruži oddaljeno?
Da. V hibridnih obravnavah, kjer je del udeležencev v dvorani in del povezan na daljavo, lahko TB-Podnaslavljalnik sprejema zvok iz različnih virov hkrati (mikrofoni v dvorani in avdio tok iz videokonferenčne platforme). Pomembno je, da je vsak vir akustično čim bolj čist; največja izguba natančnosti nastane, ko se zvok daljinske udeleženke prenaša prek slabega mikrofona ali šibke povezave.
Kdo je lastnik podatkov?
Zvočni posnetki in prepisi obravnave so v lasti sodišča kot upravljavca, Vitasis je obdelovalec po GDPR. Vsa obdelava v oblačni različici poteka v Sloveniji oziroma v EU; za sodišča in druge javne institucije je na voljo tudi popolnoma lokalna namestitev (on-premise), pri kateri zvok in prepis ne zapustita lastnega omrežja. Podatkov ne uporabljamo za splošno učenje modelov brez izrecnega soglasja.
Kakšne so cene?
Za uporabo v javnem sektorju (sodišča, tožilstva, državna uprava) cene oblikujemo individualno glede na obseg uporabe, število dvoran ali delovnih mest in raven SLA-ja. Splošno predstavitev paketov najdete na strani Cenik, za konkretno ponudbo nas kontaktirajte prek obrazca za stik.
Ali sistem podpira tudi prevajanje, recimo za priče, ki ne govorijo slovensko?
Truebar v jedru podpira prevajanje v realnem času iz slovenščine v več kot 30 jezikov in obratno. V sodnem kontekstu prevod v realnem času ne nadomesti sodno zapriseženega tolmača — uporabljamo ga kot pripomoček za hitro razumevanje vsebine, ne kot pravno veljavno tolmačenje.
Kako je z varnostjo komunikacij?
Vsa komunikacija je šifrirana s TLS, dostop do prepisov je urejen z uporabniškimi pravicami in dnevniki dostopov (audit log). Pri namestitvi na lokaciji sodišča sistem deluje znotraj internega omrežja brez zunanjih povezav.
Naslednji korak
Če v vaši instituciji razmišljate o uvedbi pretočne transkripcije ali podnaslavljanja v sodni dvorani, dvorani državnega tožilstva ali drugi formalni razpravi, vas vabimo, da nas kontaktirate prek obrazca za stik. Predstavimo vam rešitev na konkretnem primeru, pripravimo pilotno postavitev v eni dvorani in pomagamo pri akustični presoji prostora.