Tento článek spadá pod pilíř Produktové feedy a je praktickým průvodcem pro e-shopové operátory a katalogové manažery, kteří přijímají data od externích dodavatelů. Vychází z opakovaných zkušeností s importem feedů od desítek dodavatelů, kde se ukazuje, že většina problémů vzniká ne při prvním nastavení, ale při změnách struktury nebo sortimentu. Projdeme příjem dodavatelských dat, mapování polí, řešení duplicit, normalizaci kategorií a kontrolu obrazových dat a parametrů. Záměrem je poskytnout postup, který lze aplikovat na většinu běžných scénářů.

Dodavatelský feed je primární zdroj produktových dat pro e-shopy, které neprodávají vlastní výrobu. Kvalita tohoto feedu přímo ovlivňuje, jak dobře se produkty propisují na srovnávače, do marketplace katalogů a do výkonnostních kampaní. Přesto se příjmu dat věnuje často méně pozornosti než jejich následnému zpracování. To je chyba.

Příjem dodavatelských dat

První krok je jasný: získat od dodavatele feed v dohodnutém formátu a s dohodnutou periodou aktualizace. V praxi to však vypadá jinak. Dodavatelé zasílají data v různých formátech (XML, CSV, Excel, někdy i jako PDF katalog), s různou úrovní úplnosti a s různou spolehlivostí aktualizací.

Před zahájením importu doporučujeme provést vstupní audit feedu. Stáhněte si vzorek dat (prvních 100 až 200 produktů) a zkontrolujte: kolik polí feed obsahuje, jaké jsou datové typy, zda jsou povinná pole vyplněna, jaké je kódování souboru, jaký je oddělovač (u CSV) a zda jsou přítomny vnořené struktury (u XML).

Zaznamenejte si schéma feedu, ideálně v podobě jednoduché tabulky, kde je pro každé pole zdrojový název, datový typ, povinnost a vzorová hodnota. Tato tabulka slouží jako reference pro mapování a jako kontrolní bod při budoucích změnách feedu.

Ukázka vstupního auditu dodavatelského feedu s přehledem polí
Vstupní audit: přehled polí, datových typů a úplnosti dodavatelského feedu

Důležitá praxe: nikdy neimportujte feed přímo do produkčního systému. Vždy zpracujte data nejprve do mezivrstvy (staging), kde provedete validaci a transformaci. Teprve ověřená data se propisují do katalogu.

Mapování polí

Mapování polí je proces, při kterém přiřazujete sloupce nebo elementy dodavatelského feedu k polím vaší interní databáze nebo cílového feedu. Zní to mechanicky, ale v praxi je to místo, kde vzniká nejvíce chyb.

Typické problémy při mapování:

Nesoulad názvů. Dodavatel má pole "product_name", váš systém očekává "nazev". Přejmenování je triviální, ale musíte ověřit i maximální délku a povolené znaky.

Jiné jednotky. Dodavatel uvádí hmotnost v kilogramech, vaše databáze v gramech. Nebo cenu bez DPH, zatímco srovnávač očekává cenu s DPH. Transformační pravidlo musí být explicitní a verzované.

Chybějící pole. Dodavatel nemá ve feedu EAN kód pro 30 procent sortimentu. To není důvod celý feed odmítnout, ale je třeba rozhodnout, jak s těmito produkty nakládat (nižší priorita, ruční doplnění, vyloučení z některých kanálů).

Vícehodnotové atributy. Produkt má tři obrázky, ale dodavatel je posílá v jednom poli oddělené středníkem. Vaše databáze má tři samostatná pole pro obrázky. Mapování musí tuto transformaci řešit.

Pro každé pravidlo mapování definujte: zdroj, transformaci a cíl. Pravidla verzujte, aby při změně feedu bylo jasné, co se změnilo a kdy.

Deduplikace produktů

Pokud přijímáte feedy od více dodavatelů, nevyhnutelně narazíte na duplicity. Dva nebo více dodavatelů nabízejí stejný produkt s mírně odlišnými daty (jiný název, jiná cena, jiné parametry).

Nejspolehlivější klíč pro deduplikaci je EAN nebo GTIN. Jedná se o globálně unikátní identifikátor produktu, který by měl být shodný bez ohledu na dodavatele. Pokud EAN chybí (což se u některých kategorií stává), použijte kombinaci výrobce a modelového označení. Název produktu sám o sobě není spolehlivý klíč, protože dodavatelé ho formulují různě.

Pravidla prioritního dodavatele
Při deduplikaci definujte prioritního dodavatele pro každý typ dat. Cena: z interního systému nebo od dodavatele s nejlepší nákupní cenou. Popis: z PIM systému nebo od dodavatele s nejkvalitnějšími texty. Parametry: od dodavatele s nejúplnějšími technickými daty. Obrázky: od dodavatele s nejvyšším rozlišením. Skladová dostupnost: od dodavatele, který realizuje expedici. Bez těchto pravidel se při každém importu rozhodujete ad hoc, což vede k nekonzistencím.

Po deduplikaci ověřte počet unikátních produktů. Pokud se výrazně liší od očekávání (například máte 5 000 produktů ve feedech, ale po deduplikaci zbyde 3 200), prošetřete příčinu. Buď je překryv mezi dodavateli větší, než jste odhadovali, nebo deduplikační pravidlo zachytává falešné duplicity.

Normalizace kategorií

Každý dodavatel má svůj kategorizační strom. Jeden řadí "bezdrátová sluchátka" do kategorie "Elektronika > Audio", druhý do "Mobily a příslušenství > Sluchátka". Vaše interní taxonomie může být odlišná od obou.

Normalizace kategorií je převod dodavatelských kategorií na vaši interní taxonomii. Bez tohoto kroku se produkty na srovnávačích zobrazují ve špatných kategoriích, což vede k nerelevantním zobrazením a plýtvání rozpočtem na zbytečné prokliky.

Postup normalizace: vytvořte mapovací tabulku, kde levý sloupec obsahuje dodavatelskou kategorii a pravý sloupec odpovídající interní kategorii. Začněte s nejčastějšími kategoriemi (pokryjí 80 procent produktů) a zbylé řešte postupně. U nových kategorií, které nemají ekvivalent ve vaší taxonomii, rozhodněte, zda vytvořit novou kategorii, nebo produkt přiřadit k nejbližší existující.

Mapovací tabulka pro normalizaci dodavatelských kategorií
Normalizace: převod dodavatelských kategorií na interní taxonomii

Automatizace normalizace je možná u stabilních kategorií s opakujícím se sortimentem. U dynamických kategorií (móda, sezónní zboží) vyžaduje pravidelnou revizi, protože dodavatelé kategorie přidávají a mění.

Kontrola obrazových dat

Obrázky jsou kritickou součástí produktových dat. Na srovnávačích rozhodují o prokliku a na e-shopu o konverzi. Přesto je kontrola obrazových dat v dodavatelských feedech často zanedbávaná.

Co kontrolovat u obrázků z dodavatelského feedu:

Dostupnost URL. Ověřte, že všechny URL obrázků jsou funkční (HTTP 200). U velkých feedů testujte náhodný vzorek 5 až 10 procent. Nefunkční URL znamená produkt bez obrázku na srovnávači.

Rozlišení. Většina srovnávačů a marketplace vyžaduje minimální rozlišení (typicky 500x500 px). Obrázky pod tímto limitem mohou být odmítnuty nebo zobrazeny ve špatné kvalitě.

Formát. JPEG a PNG jsou standardní. WebP je podporován na většině platforem, ale ne na všech. Ověřte požadavky cílového kanálu.

Obsah. Obrázek by měl zobrazovat samotný produkt na neutrálním pozadí. Vodoznaky, reklamní texty a koláže jsou na většině srovnávačů zakázané nebo penalizované.

Duplicity. Dva různé produkty by neměly sdílet stejný obrázek. Pokud dodavatel používá generické obrázky pro více variant, ověřte, že varianta odpovídá zobrazenému produktu.

Kontrola parametrů a hygiena dat

Parametry (technické specifikace) jsou to, co odlišuje kvalitní feed od průměrného. Srovnávače je používají pro filtrování, marketplace pro zařazení do správné kategorie.

Při příjmu dodavatelského feedu kontrolujte:

Úplnost. Jaký podíl produktů má vyplněné klíčové parametry (materiál, rozměry, hmotnost, barva, výkon)? Pokud je úplnost pod 70 procent, domluvte se s dodavatelem na doplnění nebo zvažte alternativní zdroj.

Konzistence. Používá dodavatel stejné jednotky a formát pro stejný parametr? Hmotnost jednou v gramech, jednou v kilogramech, jednou jako text "cca 500g" je problém, který je třeba řešit transformačním pravidlem.

Platnost. Číselné parametry by měly být v rozumném rozsahu. Televize s hmotností 0,5 g nebo baterie s kapacitou 999 999 mAh indikují chybu v datech.

Aktuálnost. Parametry by měly odpovídat aktuální verzi produktu. Dodavatelé někdy mění specifikace bez aktualizace feedu.

Nastavte automatické kontroly, které při importu testují úplnost, konzistenci a platnost parametrů. Produkty, které neprojdou kontrolou, se nezařadí do katalogu, ale čekají na ruční opravu nebo doplnění od dodavatele.

Monitoring a údržba

Import dodavatelského feedu není jednorázový úkol. Je to nepřetržitý proces, který vyžaduje monitoring.

Nastavte alerty pro tyto situace: feed nebyl aktualizován v očekávaném čase, počet produktů ve feedu se výrazně změnil (pokles o více než 10 procent), schéma feedu se změnilo (nové pole, přejmenované pole, chybějící pole), podíl produktů s chybou překročil stanovený práh.

Pravidelně (měsíčně) revidujte mapovací pravidla a deduplikační logiku. Při přidání nového dodavatele projděte celý proces od vstupního auditu. Při změně požadavků cílové platformy (nové povinné pole na Heurece, změna formátu na Zboží.cz) aktualizujte transformační pravidla.

Pokud vás zajímá, jak se importovaná data dále zpracovávají a slučují do výstupních feedů, doporučujeme článek Spojování XML feedů a celý pilíř Produktové feedy.