Jaký formát feedu je nejspolehlivější?

Pro většinu srovnávačů a marketplace platforem je XML feed s jasně definovaným schématem nejrobustnější volbou. CSV se hodí jako doplňkový zdroj, ale náchylnost k chybám v kódování a oddělovačích ho činí méně spolehlivým pro automatizované zpracování.

Jak často by se měl produktový feed aktualizovat?

Záleží na dynamice sortimentu. E-shopy s denně měnícími se cenami nebo skladovými stavy potřebují aktualizaci minimálně jednou za hodinu. Stabilní katalogy s pomalým obratem si vystačí s denní nebo dvoudenní periodou.

Co dělat, když feed obsahuje duplicitní produkty?

Nejprve identifikujte zdroj duplicit, zda jde o problém dodavatelského feedu, chybu v interním systému, nebo překrývání variant. Poté nastavte deduplikační pravidlo podle unikátního identifikátoru (EAN, SKU nebo kombinace parametrů).

Má smysl obohacovat feed o data, která srovnávač nevyžaduje?

Pokud máte spolehlivý zdroj doplňkových atributů (materiál, rozměry, energetická třída), přidejte je. Bohatší data zlepšují filtrování na straně srovnávače a snižují míru okamžitého opuštění na produktové stránce.

Pracovní stůl s otevřeným XML editorem a tabulkou mapování produktových polí

Feedy

Produktové feedy: kompletní průvodce správou datových vstupů

Produktové feedy rozhodují o tom, jak dobře se zboží propisuje do marketplace katalogů, srovnávačů a výkonnostních kampaní. V tomto průvodci vysvětlujeme, jak feedy importovat, mapovat, čistit a kontrolovat podle postupu, který se v praxi osvědčuje u větších katalogů i menších e-shopů. Projdeme vstupní zdroje, XML a CSV formáty, mapování polí, taxonomii, obrazová data, chybovost, obohacování a exportní destinace. Pokud hledáte širší kontext o celém provozním řetězci, začněte na hlavní stránce Trayto.

Správa produktových feedů není jednorázový úkol. Je to nepřetržitý proces, ve kterém i drobná chyba v jednom poli dokáže vyřadit stovky produktů z nabídky srovnávače nebo způsobit špatnou kategorizaci na marketplace. Zkušenost ukazuje, že většina problémů nevzniká při prvním nastavení, ale při změnách v sortimentu, při přidání nového dodavatele, nebo při aktualizaci požadavků cílové platformy.

Schéma toku dat od dodavatele přes transformaci po export na srovnávač — Typický tok produktových dat od zdroje po cílovou platformu

Zdroje feedů

Produktová data vstupují do systému z několika zdrojů. Nejčastějším je interní databáze e-shopu, z níž se generuje hlavní feed. Vedle toho přicházejí dodavatelské feedy, data z ERP systémů, informace z PIM (Product Information Management) platforem, a někdy i ruční tabulky s doplňkovými atributy.

Každý zdroj má svá specifika. Interní databáze obvykle obsahuje nejspolehlivější ceny a skladové stavy. Dodavatelský feed naopak bývá bohatší na technické parametry, ale jeho kvalita kolísá. PIM systém slouží jako autoritativní zdroj pro marketingové texty a strukturovaná data.

Klíčová otázka při práci s více zdroji zní: který zdroj má prioritu, když si data protiřečí? Cena z ERP přepíše cenu od dodavatele. Popis z PIM má přednost před strojově generovaným textem. Ale skladová dostupnost se může řídit dodavatelským feedem, pokud e-shop funguje jako dropshipper. Tato pravidla musí být explicitně definována, jinak vznikají konflikty, které se projeví až na výstupu.

Pro praktický postup, jak přijmout a zpracovat dodavatelský feed krok za krokem, doporučujeme článek Import dodavatelských feedů.

XML a CSV formáty

Dva dominantní formáty pro výměnu produktových dat jsou XML a CSV. Každý má své místo, ale jejich vlastnosti se zásadně liší.

XML nabízí hierarchickou strukturu, která umožňuje vnořené elementy (varianty, parametry, více obrázků pod jedním produktem). Jasně definované schéma (XSD) dovoluje automatickou validaci. Kódování je deklarováno v hlavičce souboru, takže problémy s diakritikou jsou méně časté. Pro srovnávače jako Heureka nebo Zboží.cz je XML standardním formátem.

CSV je plochý formát. Každý řádek představuje jeden záznam, sloupce odpovídají atributům. Jednoduchost je jeho výhoda i slabina. Oddělovač (čárka, středník, tabulátor) není standardizován a liší se podle zdroje. Kódování bývá nespolehlivé, zejména u starších systémů. Vícehodnotové atributy (více obrázků, více kategorií) vyžadují workaround, typicky sloučení do jedné buňky s oddělovačem.

XML volte jako primární formát pro všechny automatizované toky. CSV používejte pro jednorázové importy, manuální úpravy nebo jako vstup z tabulkových procesorů. Pokud dodavatel zasílá CSV, převeďte ho na XML co nejdříve v řetězci, abyste měli nad daty konzistentní kontrolu.

Podle specifikace produktových dat Google Merchant Center jsou povinná pole mimo jiné identifikátor, název, popis, odkaz, odkaz na obrázek, dostupnost a cena. Tato pole tvoří společný základ i pro většinu českých srovnávačů, i když konkrétní pojmenování elementů se liší.

Mapování polí

Mapování polí je proces, při kterém se sloupce nebo elementy zdrojového feedu přiřadí k požadovaným polím cílové platformy. Zní to jednoduše, ale v praxi je to jedna z nejčastějších příčin chyb.

Typické problémy:

Zdrojový feed má pole nazev_produktu, cílová platforma očekává PRODUCTNAME. Přejmenování nestačí, je třeba ověřit i maximální délku, povolené znaky a pravidla pro velká písmena.
Cena ve zdroji je bez DPH, srovnávač ji očekává s DPH. Transformační pravidlo musí aplikovat správnou sazbu a zaokrouhlení.
Kategorie ve zdroji je textový řetězec ("Elektronika > Mobily > Příslušenství"), cílová platforma má číselný identifikátor z vlastní taxonomie.
EAN kód chybí u části sortimentu. Srovnávač ho neoznačí jako povinný, ale produkty bez EAN mají výrazně nižší viditelnost.

Dobře nastavené mapování funguje jako vrstva transformačních pravidel. Každé pravidlo definuje: odkud se data berou, jak se transformují a kam se zapisují. Pravidla by měla být verzovaná a auditovatelná, protože změna v jednom mapování může ovlivnit tisíce produktů.

Tabulka mapování polí mezi dodavatelským feedem a cílovými platformami — Příklad mapovací tabulky: zdrojové pole, transformace, cílové pole

Taxonomie a kategorizace

Kategorizace produktů je oblast, kde se setkávají obchodní logika a technické požadavky. Každá platforma má vlastní strom kategorií. Google používá svou taxonomii, Heureka má vlastní kategorizační systém, marketplace jako Mall nebo Alza mají další.

Správný přístup zahrnuje tři kroky. Nejprve zmapujte svůj interní kategorizační strom. Poté pro každou cílovou platformu vytvořte mapovací tabulku, která přiřadí vaše kategorie k jejich. Nakonec nastavte pravidla pro nové produkty, aby se automaticky zařadily na základě parametrů (typ produktu, značka, klíčové atributy).

Pozor na kategorizační mezery. Některé vaše kategorie nebudou mít přímý protějšek v taxonomii cílové platformy. V takovém případě je lepší produkt zařadit do nadřazené (obecnější) kategorie než ho vynechat. Chybějící kategorizace znamená, že produkt se ve filtrech nezobrazí.

Obrazová data

Obrázky patří mezi nejčastěji podceňované atributy v produktovém feedu. Přitom právě kvalita hlavního obrázku rozhoduje o tom, zda zákazník na srovnávači klikne nebo ne.

Požadavky na obrázky se liší platforma od platformy, ale existují společné principy. Minimální rozlišení by mělo být alespoň 800 x 800 pixelů. Obrázek by měl zobrazovat samotný produkt na čistém pozadí (bílé nebo světle šedé). Vodoznaky, reklamní popisky a složené kompozice většina platforem buď odmítne, nebo penalizuje nižší prioritou.

Technické aspekty, které je třeba hlídat:

URL obrázku musí být stabilní a přístupná. Pokud se adresa změní bez aktualizace feedu, srovnávač zobrazí prázdnou náhledovku nebo produkt stáhne z nabídky.
Formát JPEG je preferovaný. PNG je přijatelné pro produkty, kde transparentní pozadí pomáhá, ale velikost souboru bývá výrazně vyšší.
Více obrázků na produkt je výhodou. Hlavní obrázek plus dva až tři doplňkové snímky z různých úhlů zvyšují důvěryhodnost nabídky.
Pojmenování souborů by mělo být systematické, ideálně obsahující SKU nebo EAN v názvu.

Při každé aktualizaci feedu spusťte automatickou kontrolu, která ověří: (1) zda URL obrázku vrací HTTP 200, (2) zda rozlišení splňuje minimum cílové platformy, (3) zda nejsou duplicitní obrázky u různých produktů. U katalogů nad 5 000 položek se vyplatí tuto kontrolu provádět inkrementálně, pouze u změněných záznamů.

Kontrola chyb

Validace feedu je poslední brána před tím, než se data odešlou na cílovou platformu. Dobře nastavená validace zachytí problémy dříve, než je zachytí srovnávač (s potenciálně horšími důsledky, jako je dočasné vyřazení produktu).

Rozlišujeme tři úrovně chyb:

Kritické chyby zabraňují zpracování záznamu. Chybějící povinné pole (identifikátor, název, cena, odkaz), nevalidní XML struktura, nebo cena s hodnotou 0. Tyto chyby musí blokovat export.

Varování nebrání zpracování, ale signalizují problém s kvalitou. Příliš krátký název (pod 20 znaků), chybějící popis, obrázek v nízkém rozlišení, nebo kategorie, která neodpovídá žádnému záznamu v taxonomii cílové platformy.

Informační hlášení upozorňují na odchylky, které mohou, ale nemusí být problémem. Neobvykle vysoká cena (možný překlep), více než 10 variant u jednoho produktu, nebo popis delší než 5 000 znaků.

Validaci provádějte ve dvou fázích. Nejprve schématická validace (odpovídá feed deklarované struktuře?), poté obsahová validace (jsou hodnoty v polích smysluplné?). Tuto kontrolu můžete začít s naším Feed validátorem.

Obohacování dat

Obohacování (enrichment) feedu znamená doplnění dat, která ve zdrojovém feedu chybí, ale na cílové platformě zvyšují viditelnost nebo konverzní poměr.

Nejčastější typy obohacení:

Doplnění EAN/GTIN z externích databází. Produkt s EAN má na většině srovnávačů vyšší prioritu.
Doplnění parametrů z technických specifikací výrobce. Materiál, hmotnost, rozměry, energetická třída. Tyto údaje umožňují zákazníkovi filtrovat a porovnávat produkty.
Generování popisů pomocí AI nástrojů s lidskou kontrolou. Tento proces má vlastní metodiku, kterou podrobně pokrýváme v pilíři AI popisy produktů.
Překlad atributů pro export na zahraniční marketplace. Přeložit název a popis nestačí, je třeba lokalizovat i jednotky (cm vs. palce), velikostní tabulky a specifické označení.

Zásadní pravidlo: obohacená data musí být ověřitelná. Pokud AI vygeneruje popis, který uvádí "vodotěsnost IP68", ale zdrojová data tuto informaci neobsahují, jde o halucinaci, která může vést k reklamacím.

Exportní destinace

Finální feed se exportuje na jednu nebo více cílových platforem. Každá platforma má specifické požadavky na formát, frekvenci aktualizace a způsob doručení.

Srovnávače cen (Heureka, Zboží.cz, Glami, Favi) typicky přijímají XML feed stažený z URL. Frekvence stahování se pohybuje od jednou za hodinu po jednou za den. Klíčové je, aby URL vracela vždy aktuální data, ne cachovanou verzi z rána.

Marketplace (Mall, Alza Marketplace, Kaufland) mají přísnější validaci a často vyžadují kromě feedu i aktivní integraci přes API. Detaily o připravenosti na marketplace najdete v pilíři Marketplace integrace.

PPC systémy (Google Ads, Sklik, Meta Ads) pracují s feedem pro dynamické reklamy. Kvalita feedu přímo ovlivňuje relevanci zobrazovaných produktů. Špatně mapovaný feed znamená špatně cílené reklamy a zbytečné náklady.

Vlastní e-shop může být také cílovou destinací, pokud pracujete s centrálním PIM a feed je distribuční vrstvou i pro vlastní web.

Ideální architektura produktových dat pracuje s jedním centrálním zdrojem (PIM, interní databáze), z něhož se generují všechny výstupní feedy. Každý exportní kanál má vlastní transformační vrstvu, ale zdrojová data se editují na jednom místě. Jakmile začnete opravovat data přímo v exportním feedu, ztrácíte kontrolu a vytváříte divergentní kopie.

Při nastavování exportních destinací nezapomínejte na monitoring. Každý kanál by měl mít nastaveno sledování počtu aktivních produktů, chybovosti a doby odezvy feedového endpointu. Pokles počtu aktivních produktů o více než 5 % během jednoho dne je varovný signál, který vyžaduje okamžité vyšetření.

Správa produktových feedů je disciplína, která se dá zvládnout systematicky. Klíčem je jasně definovaný tok dat, konzistentní mapování, průběžná validace a monitoring výstupů. Pokud některý z těchto článků řetězce selže, důsledky se projeví na všech navazujících kanálech. Proto doporučujeme začít od zdroje a postupně zpevňovat každý krok, místo pokusu opravovat problémy na konci řetězce.

Časté otázky

: Pro většinu srovnávačů a marketplace platforem je XML feed s jasně definovaným schématem nejrobustnější volbou. CSV se hodí jako doplňkový zdroj, ale náchylnost k chybám v kódování a oddělovačích ho činí méně spolehlivým pro automatizované zpracování.
: Záleží na dynamice sortimentu. E-shopy s denně měnícími se cenami nebo skladovými stavy potřebují aktualizaci minimálně jednou za hodinu. Stabilní katalogy s pomalým obratem si vystačí s denní nebo dvoudenní periodou.
: Nejprve identifikujte zdroj duplicit, zda jde o problém dodavatelského feedu, chybu v interním systému, nebo překrývání variant. Poté nastavte deduplikační pravidlo podle unikátního identifikátoru (EAN, SKU nebo kombinace parametrů).
: Pokud máte spolehlivý zdroj doplňkových atributů (materiál, rozměry, energetická třída), přidejte je. Bohatší data zlepšují filtrování na straně srovnávače a snižují míru okamžitého opuštění na produktové stránce.