Případová studie: AI produktové popisy v praxi a jejich kvalitativní kontrola
Tento článek patří do oblasti AI produktových popisů a je určen provozním manažerům a katalogistům, kteří zvažují nebo již zavádějí automatické generování popisů ve větším měřítku. Vychází ze zkušeností s nasazením AI popisů u katalogu s více než 8 000 položkami, kde ruční tvorba trvala měsíce a aktualizace se nestíhaly. V následujících sekcích projdeme přípravu vstupního datasetu, zachování klíčových atributů, řízení tónu, nastavení QA workflow, typické třídy chyb a situace, kdy musí zasáhnout člověk. Cílem není přesvědčit o tom, že AI nahradí copywritery, ale ukázat, jak vypadá realistické nasazení s měřitelnými výsledky.
Generování produktových popisů pomocí AI zní jednoduše. V praxi jde o řetězec kroků, kde každý ovlivňuje výslednou kvalitu. Pokud jsou vstupní data nekompletní, AI si informace domyslí. Pokud je prompt příliš obecný, výstup bude generický. A pokud chybí kontrolní mechanismus, chyby se propíší do feedu a odtud na srovnávače i marketplace.
Příprava vstupního datasetu
Kvalita AI popisů stojí a padá s kvalitou vstupních dat. Než vůbec spustíte první generování, musíte mít data v pořádku.
V případě, o kterém mluvíme, byl výchozí stav následující: katalog obsahoval 8 400 produktů v 12 kategoriích. U každého produktu byla k dispozici interní databáze s názvem, cenou, EAN kódem, kategorií a základními parametry. Dodavatelský feed přidával technické specifikace, obrázky a rozšířené atributy. Problém byl v tom, že přibližně 35 procent produktů mělo nekompletní parametry a 12 procent mělo konflikt mezi interními a dodavatelskými daty.
První krok tedy nebyl generování popisů, ale čištění dat. Konkrétně: sjednocení formátu parametrů (jednotky, oddělovače, přesnost), doplnění chybějících atributů tam, kde byly k dispozici z alternativního zdroje, a označení produktů, kde data nestačila pro kvalitní popis. Tyto produkty (asi 400 položek) zůstaly v režimu ruční tvorby.
Při přípravě datasetu se osvědčilo rozdělit produkty do tří skupin podle datové úplnosti. První skupina (plná data, 53 procent katalogu) šla rovnou do automatického generování. Druhá skupina (částečná data, 35 procent) vyžadovala doplnění před generováním. Třetí skupina (nedostatečná data, 12 procent) se zpracovávala ručně. Toto třídění ušetřilo čas i peníze, protože se AI nespoušťěla na datech, kde by výstup stejně neprocházel kontrolou.
Zachování atributů a přesnost parametrů
Největší riziko AI popisů je ztráta nebo zkreslení technických parametrů. Model má tendenci parafrázovat číselné údaje ("přibližně 500 g" místo "498 g"), vynechávat atributy, které považuje za méně důležité, nebo přidávat informace, které ve vstupních datech nejsou.
Pro zachování atributů jsme zavedli tři opatření. Zaprvé, v promptu je explicitní instrukce: "Uveď všechny parametry přesně tak, jak jsou v datech. Nepřidávej informace, které v datech chybí." Zadruhé, automatická kontrola porovnává klíčové parametry (hmotnost, rozměry, materiál, výkon) ve výstupu se zdrojovými daty. Pokud se hodnota liší nebo chybí, popis se označí k revizi. Zatřetí, u citlivých kategorií (elektronika, potraviny, kosmetika) prochází 100 procent popisů lidskou kontrolou atributů.
Výsledek po kalibraci: 72 procent popisů mělo všechny klíčové atributy správně hned napoprvé. Dalších 18 procent mělo drobné odchylky (zaokrouhlení, přeformulování), které automatická kontrola zachytila. Zbylých 10 procent vyžadovalo ruční opravu.
Řízení tónu a konzistence stylu
Tón popisů musí být konzistentní napříč celým katalogem. Zákazník, který čte popisy v jedné kategorii, by neměl mít pocit, že texty psali různí lidé s odlišným přístupem.
Definovali jsme tónový profil se čtyřmi parametry: úroveň odbornosti (střední, srozumitelná pro laika), forma oslovení (vykání), délka (120 až 250 slov podle kategorie), a emoční zabarvení (věcné, bez superlativů). Tento profil se promítl do promptu a do hodnotícího checklistu pro revizory.
Důležitý poznatek: tón se musí kalibrovat po kategoriích. Popis sportovního vybavení může být trochu dynamičtější než popis průmyslového příslušenství. Ale základní parametry (vykání, absence superlativů, faktická přesnost) platí univerzálně.
QA workflow a automatická kontrola
Kontrola kvality nemůže být náhodná. Potřebujete systematický proces, který kombinuje automatické a manuální kroky.
Náš workflow měl čtyři úrovně. První úroveň: automatická kontrola formátu (délka, přítomnost povinných sekcí, základní jazyková kontrola). Druhá úroveň: automatická kontrola atributů (porovnání parametrů ve výstupu se zdrojovými daty). Třetí úroveň: náhodný vzorek 15 procent popisů prochází manuální revizí. Čtvrtá úroveň: kvartální audit celého katalogu na vzorku 200 popisů.
Klíčové je mít jasně definovaná kritéria pro každou úroveň. Automatická kontrola formátu je binární (splňuje/nesplňuje). Kontrola atributů má tři stupně (správně, drobná odchylka, chyba). Manuální revize hodnotí na škále 1 až 5 podle pěti dimenzí (faktická správnost, tón, čitelnost, úplnost, relevance).
Pro správu celého procesu jsme využívali tabulku, kde každý produkt měl stav: čeká na generování, vygenerováno, automaticky schváleno, k manuální revizi, schváleno, zamítnuto. Tento jednoduchý systém stavů stačil pro katalog do 10 000 položek.
Typické třídy chyb
Po zpracování více než 6 000 popisů jsme identifikovali pět opakujících se tříd chyb.
Halucinace parametrů. AI přidá technický parametr, který ve vstupních datech není. Například uvede "vodotěsnost IP67" u produktu, kde tato informace chybí. Frekvence: 4 až 6 procent popisů před kalibrací, 1 až 2 procenta po kalibraci.
Zaokrouhlování hodnot. Model změní "498 g" na "přibližně 500 g" nebo "2 480 mAh" na "2 500 mAh". Frekvence: 8 až 12 procent. Řešení: explicitní instrukce v promptu a automatická kontrola číselných hodnot.
Tónový výkyv. Popis jednoho produktu je výrazně formálnější nebo naopak neformálnější než ostatní v téže kategorii. Frekvence: 5 až 8 procent. Řešení: přidání vzorových popisů do promptu.
Vynechání atributu. Model vypustí parametr, který je ve vstupních datech, protože ho považuje za méně důležitý pro plynulost textu. Frekvence: 10 až 15 procent před kalibrací, 3 až 5 procent po kalibraci.
Generický jazyk. Popis je fakticky správný, ale neobsahuje nic konkrétního. Typický příklad: "Tento kvalitní produkt vás potěší svým designem a praktičností." Frekvence: 15 až 20 procent u prvních dávek, pod 5 procent po úpravě promptu.
Kdy musí zasáhnout člověk
Automatizace má své hranice. Existují situace, kde lidský zásah není volitelný, ale nutný.
Nové kategorie. Při prvním generování popisů pro kategorii, která dosud v katalogu nebyla, je třeba lidská kalibrace. AI nemá vzor, podle kterého se řídit, a prompt pro jinou kategorii nemusí fungovat.
Právně citlivé produkty. Kosmetika, doplňky stravy, dětské zboží. U těchto kategorií mohou nepřesné nebo zavádějící popisy vést k právním problémům. Lidská revize je povinná pro 100 procent popisů.
Produkty s nedostatečnými daty. Pokud vstupní data obsahují jen název, cenu a kategorii, AI vygeneruje generický text plný domněnek. Lepší je takový produkt nechat bez AI popisu a doplnit data.
Konfliktní zpětná vazba. Pokud automatická kontrola hlásí odchylku, ale revizor ji označí jako přijatelnou, je třeba rozhodnout, zda upravit pravidla kontroly, nebo prompt. Tento typ rozhodnutí vyžaduje člověka se znalostí kontextu.
Sezonní a akční produkty. Popisy, které odkazují na sezónu nebo akci, zastarávají rychle. AI generuje "nadčasový" text, ale pokud je třeba zmínit konkrétní kontext (vánoční kolekce, letní výprodej), musí to doplnit člověk.
Shrnutí a provázanost s dalšími procesy
AI produktové popisy ve velkém měřítku fungují, pokud jsou splněny tři podmínky: kvalitní vstupní data, kalibrovaný prompt a systematická kontrola kvality. Bez kterékoli z nich se kvalita rychle rozpadá.
Výsledky případové studie: z 8 400 produktů bylo 5 200 zpracováno plně automaticky (s automatickou kontrolou), 2 800 prošlo manuální revizí a 400 zůstalo v režimu ruční tvorby. Celkový čas zpracování se zkrátil z odhadovaných 6 měsíců na 5 týdnů. Náklady na generování a kontrolu činily přibližně 40 procent nákladů na čistě ruční tvorbu.
Pro návaznost na distribuci vytvořených popisů do datových výstupů doporučujeme pilíř Produktové feedy. Pokud vás zajímá celý kontext workflow, přečtěte si průvodce AI popisy produktů, který pokrývá i promptování, dávkové zpracování a nastavení prahů lidské revize.
Časté otázky
- U dobře připravených vstupních dat a stabilního promptu typicky 60 až 75 procent popisů nevyžaduje zásadní přepis. Zbylá čtvrtina až třetina potřebuje opravu faktických chyb, úpravu tónu nebo doplnění chybějících atributů.
- Vynechání nebo zkreslení technického parametru. Model má tendenci parafrázovat číselné hodnoty nebo přidávat atributy, které ve zdrojových datech nejsou. Proto je kontrola proti původnímu feedu nezbytná.
- U katalogů pod 200 produktů je přínos menší, protože režie na přípravu promptu a QA procesu může převýšit úsporu času. Od zhruba 500 položek výše začíná být automatizace ekonomicky smysluplná.
- Nejspolehlivější je generovat popisy v primárním jazyce a poté je překládat samostatným krokem s vlastním promptem. Generování přímo ve více jazycích současně zvyšuje riziko terminologických chyb.