Temu i Shein 2026: jak zrealizować parsing oferty i śledzić trendy – krok po kroku
Spis treści
- Wprowadzenie
- Przygotowanie wstępne
- Podstawowe pojęcia
- Krok 1: określamy cele parsyngowania i metryki
- Krok 2: przygotowujemy środowisko robocze i sieć
- Krok 3: rozumiemy cechy antybotowe temu i shein
- Krok 4: wyciągamy karty z list kategorii i wyszukiwania
- Krok 5: parsujemy kartę produktu na temu
- Krok 6: parsujemy kartę produktu na shein
- Krok 7: strukturujemy dane, eliminujemy duplikaty, konfigurujemy przechowywanie
- Krok 8: zbieramy ceny, promocje i dostawę z uwzględnieniem regionów i czasu
- Krok 9: znajdujemy zyskowne produkty i prognozujemy popyt
- Krok 10: rola mobilnych proxy różnych regionów i jak je poprawnie skonfigurować
- Krok 11: automatyzacja codziennych biegów i raportów
- Krok 12: weryfikacja wyniku
- Krok 13: typowe błędy i rozwiązania
- Krok 14: dodatkowe możliwości
- Faq
- Podsumowanie
Wprowadzenie
W tym praktycznym przewodniku krok po kroku skonfigurujesz działający cały proces parsyngowania Temu i Shein na rok 2026: od pierwszego sprawdzenia połączenia do codziennej aktualizacji cen, obrazów, wariantów i metryk popytu. Na końcu będziesz miał proces, który identyfikuje zyskowne produkty i przewiduje trendy dla dropshippingu, uwzględniając rzeczywiste polityki antybotowe platform oraz regionalne różnice cenowe.
Dla kogo jest ten przewodnik: dla początkujących dropshipperów, marketerów, analityków i właścicieli małych sklepów internetowych. Materiał jest przygotowany tak, abyś mógł osiągnąć rezultaty bez głębokiej wiedzy z zakresu programowania. Jednocześnie zawiera sekcje z zaawansowanymi możliwościami rozszerzenia.
Co powinieneś wiedzieć wcześniej: podstawowa obsługa przeglądarki, zrozumienie czym są proxy i dlaczego region ma znaczenie dla cen Temu i Shein. Jeśli słyszałeś o JSON, cookies i nagłówkach, będzie łatwiej, ale to nie jest konieczne. Wyjaśnimy wszystkie kluczowe pojęcia.
Ile czasu to zajmie: podstawowa konfiguracja zajmie 3-4 godziny, pierwszy stabilny bieg danych zajmie 1 dzień roboczy, automatyzacja i raporty 1-2 dni. Pełna eksploatacja - z codziennymi aktualizacjami - zacznie przynosić korzyści już w pierwszym tygodniu.
Przygotowanie wstępne
Przed rozpoczęciem zbierz narzędzia i stwórz bezpieczne środowisko. To zmniejszy liczbę błędów i przyspieszy pracę.
Wymagane narzędzia
- Nowoczesna przeglądarka z trybem dewelopera.
- Edytor tekstu lub arkusze do zapisywania ustawień i wyników.
- Menedżer zadań do planowania codziennych biegów.
- Przechowywanie: lokalne foldery na obrazy i CSV, preferowane połączenie z bazą danych.
- Proxy z mobilnymi IP dla stabilnego dostępu do Temu i Shein w odpowiednich regionach.
Wymagania systemowe
- OS: Windows 10/11, macOS 12+, lub jakikolwiek obsługiwany system Linux.
- RAM: od 8 GB, dla zadań równoległych lepiej 16 GB.
- Wolne miejsce: 10-50 GB na obrazy i logi.
- Niezawodny internet 20+ Mbps dla stabilnego ładowania mediów.
Co zainstalować i skonfigurować
- Przeglądarkę z włączonym trybem dewelopera. Sprawdź zakładkę Sieć i Przechowywanie.
- Planer zadań: wbudowany planer systemu operacyjnego lub dowolny odpowiednik.
- Narzędzia do sprawdzania sieci: sprawdzenie IP, test DNS Leak, Proxy Checker, mapa opóźnień, kalkulator proxy, generator odcisków przeglądarki. Te darmowe narzędzia pomogą szybko upewnić się, że widzisz regionalne ceny poprawnie.
- Foldery projektu: data/raw dla oryginalnych HTML i JSON, data/images dla obrazów, data/csv dla eksportów, logs dla dzienników zapytań.
Kopie zapasowe
- Codziennie kopiuj foldery data i logs do oddzielnego archiwum.
- Dla CSV użyj kopii z datą w nazwie.
- Jeśli korzystasz z bazy danych, skonfiguruj codzienny dump.
✅ Sprawdzenie: Musisz mieć działającą strukturę folderów data/raw, data/images, data/csv i logs, dostęp do narzędzi do sprawdzania IP i opóźnień, oraz zapisany plan pierwszego biegu.
Porada: Od samego początku prowadź dziennik działań: data, co zrobiłeś, co zmieniłeś, jakie błędy wystąpiły. To oszczędza godziny podczas debugowania.
Podstawowe pojęcia
Kluczowe terminy w prostym języku
- Karta produktu: strona lub wpis z nazwą, ceną, zdjęciem, rozmiarem, kolorami, oceną i innymi polami.
- Sessja: ciągły okres pracy z witryną z jednego IP i jednego profilu przeglądarki.
- Rotacja IP: automatyczna zmiana IP po określonym czasie.
- Cena regionalna: koszt, który zależy od kraju, miasta lub operatora.
- Antybot: mechanizmy, które identyfikują podejrzaną aktywność i ograniczają dostęp.
Główne zasady
- Składaj niewiele zapytań w krótkim okresie czasu i utrzymuj stabilne sesje.
- Przestrzegaj zasad robots.txt i warunków korzystania z platform.
- Przechowuj surowe dane: HTML, JSON odpowiedzi, znaczniki czasowe.
- Zawsze sprawdzaj region widocznych cen za pomocą sprawdzenia IP i mapy opóźnień.
Co ważne zrozumieć
- Temu i Shein pokazują produkty i ceny na różne sposoby w różnych regionach i na różnych urządzeniach. Mobilne IP pomagają widzieć te same ceny, które widzą prawdziwi klienci ze smartfonów.
- Interfejs może dynamicznie ładować dane. Czasami karta produktu przychodzi w postaci JSON, a nie statycznego HTML.
- Okresowość aktualizacji jest istotna: trendy żyją krótko.
Porada: Zanim rozpoczniesz skalowanie zbierania danych, przejdź ręcznie jeden cykl: otwórz kategorie, przefiltruj produkty, wejdź w 5-10 kart i zapisz, które pola widzisz dokładnie.
Krok 1: Określamy cele parsyngowania i metryki
Cel etapu: Uformować wyraźną listę danych, które będziesz zbierał, oraz zrozumieć, jak będziesz oceniać popyt i trendy.
Szczegółowa instrukcja
- Określ rynki: np. UE, USA lub konkretne kraje. Zapisz priorytety dotyczące walut i języków.
- Wybierz kategorie: odzież dla kobiet, akcesoria, artykuły do domu, elektronika itd. Zacznij od 1-2 kategorii, aby przyspieszyć debugowanie.
- Stwórz listę pól karty: nazwa, marka, numer katalogowy, kategoria, podkategorie, cena, stara cena, zniżka w procentach, waluta, dostępność, czas dostawy, koszt dostawy, ocena, liczba recenzji, liczba zamówień, obrazy, wideo, warianty rozmiaru i koloru, atrybuty materiału, wymiary paczki, waga, słowa kluczowe, tagi, data odkrycia.
- Określ dodatkowe metryki popytu: dynamika ceny za 7 i 30 dni, przyrost recenzji za 7 dni, prędkość pojawiania się nowych zdjęć od klientów, względny rang w kategorii.
- Zapisz KPI: dokładność parsyngowania 98%+, udział udanych kart 95%+, stabilność codziennej aktualizacji 99%+.
Ważne punkty: im dokładniej określone pola, tym łatwiej sprawdzać i poprawiać błędy. Listę pól lepiej przechowywać w osobnym dokumencie.
✅ Sprawdzenie: Masz dokument z listą rynków docelowych, kategorii, pól kart i metryk oraz tabelę KPI.
Porada: Dodaj pole "status karty": nowa, zaktualizowana, usunięta, ukryta. To uprości porównania pomiędzy dniami.
Możliwe problemy i rozwiązania
- Zbyt wiele pól wprowadza zamęt → Zmniejsz do minimalnie użytecznego zestawu i dodawaj w miarę potrzeb.
- Niejasne jak mierzyć popyt → Rozpocznij od przyrostu recenzji i względnego rankingu w kategorii.
Krok 2: Przygotowujemy środowisko robocze i sieć
Cel etapu: Skonfigurować stabilne połączenie sieciowe i otoczenie, aby strony Temu i Shein otwierały się z poprawnymi regionalnymi cenami i bez zakłóceń.
Szczegółowa instrukcja
- Stwórz profil przeglądarki „temu-shein-2026" i włącz tryb dewelopera.
- Podłącz mobilne proxy odpowiedniego regionu. Wskaź protokół HTTP(S) lub SOCKS5.
- Sprawdź IP i region za pomocą narzędzia do sprawdzania IP i mapy opóźnień. Upewnij się, że kraj i miasto odpowiadają rynkowi docelowemu.
- Uruchom test DNS Leak, aby upewnić się, że ustawienia sieciowe są zgodne.
- Otwórz stronę główną Temu. Sprawdź walutę, język, banery dostawy. Zapisz, czy odpowiadają wybranemu regionowi.
- Otwórz Shein i powtórz kontrolę. Porównaj walutę i koszt dostawy.
- Skonfiguruj rotację IP według timera, na przykład co 15-30 minut, oraz opcję ręcznej zmiany za pomocą linku lub API w przypadku błędów.
- Sprawdź stabilność: kolejno otwórz 5-7 kart z jednej kategorii, upewniając się o tej samej walucie i rozpoznawalnych wzorcach cen.
Ważne punkty: dla poprawnego parsyngowania ważne jest używanie rzeczywistych mobilnych IP i utrzymanie "lepkiej" sesji 10-30 minut dla spójności danych. Niezbyt wymagające zadania można aktualizować przy zmianie IP.
⚠️ Uwaga: Przestrzegaj wszystkich warunków korzystania z platform oraz etycznych norm zbierania danych. Nadmiar zapytań może prowadzić do ograniczeń. Zawsze testuj obciążenia na niewielkiej liczbie zapytań.
✅ Sprawdzenie: Ceny i waluta na obu platformach są zgodne z rynkiem docelowym, test DNS jest czysty, opóźnienia do rynku docelowego są akceptowalne na mapie opóźnień, rotacja IP działa według timera i ręcznie.
Porada: Jeśli masz kilka rynków, stwórz oddzielne profile przeglądarki i osobne ustawienia rotacji dla każdego regionu. To zredukuje zamieszanie.
Krok 3: Rozumiemy cechy antybotowe Temu i Shein
Cel etapu: Uformować bezpieczny model zachowań, aby uniknąć podejrzanej aktywności i uzyskać stabilną próbkę.
Szczegółowa instrukcja
- Ustabilizuj podstawowy limit: nie więcej niż 1-2 zapytania na sekundę na domenę w szczycie, a lepiej równomiernie 1 zapytanie co 1-2 sekundy na strumień.
- Użyj stabilnych sesji: ten sam profil, te same nagłówki i język interfejsu dla serii zapytań.
- Imitacja rzeczywistego zachowania: otwieraj najpierw listę, potem kartę, przewijaj obrazy, zachowuj niewielkie przerwy 1-4 sekundy.
- Obserwuj odpowiedzi serwera: kody 200, 301-302, 403, 429. Przy 429 zrób przerwę 2-5 minut i zmień IP przy ręcznej rotacji. Przy 403 zmniejsz częstotliwość lub zmień region.
- Rejestruj cookies i lokalne przechowywanie przez czas lepkiej sesji i aktualizuj tylko przy restarcie sesji.
Ważne punkty: Temu i Shein dynamicznie zmieniają interfejs i metody ładowania. Powtarzaj ręczną kontrolę interfejsów raz w tygodniu i aktualizuj swoje instrukcje zbierania pól.
✅ Sprawdzenie: Przy surfowaniu ze stabilną prędkością otwierasz 10-20 kart z rzędu bez pojawiania się nietypowych kontroli, ceny i język nie "skaczą", kod odpowiedzi 200 jest stabilny.
Porada: Jeśli pracujesz w paczkach, rób krótkie serie po 50-100 kart z 5-10 minutowymi przerwami między seriami. To znacząco zwiększa stabilność.
Krok 4: Wyciągamy karty z list kategorii i wyszukiwania
Cel etapu: Uzyskać stabilną listę linków do produktów w wybranych kategoriach i wyszukiwania, uwzględniając sortowania i filtry.
Szczegółowa instrukcja
- Określ źródło listy: kategoria, zbiór „nowości”, „top sprzedaży”, „zniżki” lub zapytanie wyszukiwania po słowie kluczowym.
- Otwórz stronę kategorii Temu. Włącz tryb dewelopera i obserwuj zakładkę Sieć, aby zobaczyć, czy lista ładowana jest przez API JSON czy bezpośredni HTML. Zapisz URL i parametry.
- Przewiń stronę do końca, aby załadować wszystkie porcje listy. Powoli i z przerwami, aby nie powodować skoków ładowania.
- Zapisz HTML strony i odpowiedzi JSON w folderze data/raw z datą i godziną.
- Powtórz te same czynności na Shein. Osobno sprawdź sortowania według „nowości”, „popularności” i „ceny”.
- Wykonaj eksport linków do kart: wyciągnij identyfikatory produktów, URL kart i pierwsze widoczne parametry, np. cena i zniżka z snippet.
- Podziel końcową listę z każdej kategorii na paczki po 50-100 linków.
Ważne punkty: Istotne jest zapisanie dokładnego sortowania i filtrów. Mają one wpływ na trendy i kolejność rezultatów. Do codziennych powtórzeń używaj tych samych parametrów.
⚠️ Uwaga: Nie uruchamiaj dziesiątek równoległych ładowań list. Tempo jest ważniejsze niż ilość. Powtarzaj eksporty częściej, ale mniejszymi porcjami.
✅ Sprawdzenie: Masz plik z listą linków do kart i identyfikatorów produktów dla każdej kategorii Temu i Shein. W folderze data/raw znajdują się zapisane HTML i JSON z pieczęcią czasu.
Porada: Wprowadź pole „source_tag” dla każdej paczki, np. temu_cat_women_dresses_popular_2026-03-10_10-30. Pomoże to śledzić, z jakiego typu wyników pochodzi każdy produkt.
Możliwe problemy i rozwiązania
- Część produktów nie ładuje się przy przewijaniu → Zwiększ przerwy, przewijaj wolniej, obserwuj statusy XHR w panelu Sieć.
- Lista wraca pusta → Sprawdź region, walutę i IP. Przy niezgodności z regionem strona może filtrować asortyment.
Krok 5: Parsujemy kartę produktu na Temu
Cel etapu: Nauczyć się stabilnie wyciągać wszystkie kluczowe pola karty produktu na Temu, w tym warianty, zdjęcia i ceny.
Szczegółowa instrukcja
- Otwórz pierwszą kartę produktu z listy Temu. Zapisz strukturę: nagłówek, blok ceny, starej ceny, procenta zniżki, wybór wariantu.
- Sprawdź, jak ładują się obrazy: często miniatury i oryginały mają różne URL. Kliknij na obrazek, zobacz w Sieci zapytania do CDN i zapisz link do oryginalnego rozmiaru.
- Wyciągnij metadane: marka, numer katalogowy, materiały, rozmiary, waga, informacje o dostawie i zwrocie. Wiele parametrów jest ukrytych w sekcjach lub zakładkach, przewiń niżej.
- Zbierz dane dotyczące wariantów: kolory, rozmiary, kody wariantów, dostępność na składzie, różnice cenowe między wariantami.
- Zarejestruj oceny i recenzje: średnia ocena, liczba recenzji, obecność zdjęć od klientów, daty najnowszych recenzji.
- Zapisz wszystkie znalezione pola w tymczasowym zapisie: nagłówek, kategoria, cena, stara cena, waluta, zniżka, identyfikator produktu, URL karty, URL obrazów, lista wariantów z ich ceną i stanem.
- Pobierz obrazy do data/images, stosując sensowne nazwy plików: temu_productId_main_1.jpg, temu_productId_variant_blue_1.jpg. Przechowuj również tabelę przyporządkowującą productId do lokalnych nazw plików.
Ważne punkty: Niektóre karty Temu ładują bloki przez dynamiczne zapytania. Zachowuj surowe odpowiedzi JSON w data/raw. To pomoże przy ponownej obróbce bez ponownego zapytania do strony.
✅ Sprawdzenie: W CSV lub tabeli masz pełne pola karty Temu, a w folderze obrazów znajdują się odpowiednie zdjęcia w oryginalnej jakości. Identyfikatory i linki są zgodne.
Porada: Dodaj pole „image_hash” dla każdego zdjęcia. To pozwoli śledzić wymianę obrazów i wychwytywać duplikaty.
Możliwe problemy i rozwiązania
- Cena zmienia się przy wyborze wariantu → Wprowadź podstawową cenę karty i cenę każdego wariantu oddzielnie. W raportach pokaż minimalną, maksymalną i medianową cenę.
- Linki do obrazów wygasają → Pobierz natychmiast i przechowuj lokalnie. W raportach używaj lokalnych ścieżek.
Krok 6: Parsujemy kartę produktu na Shein
Cel etapu: Nauczyć się stabilnie wyciągać kluczowe pola karty na Shein, uwzględniając specyficzne atrybuty modowych kategorii.
Szczegółowa instrukcja
- Otwórz kartę Shein, zapisz nagłówek, markę Shein lub zewnętrzną, naklejki promocji, starą i nową cenę.
- Sprawdź blok rozmiarów: dla odzieży często istnieją tabele rozmiarów i wskazówki dotyczące dopasowania. Zachowaj tabelę rozmiarów jako osobne pole.
- Przewiń do recenzji: zapisz średnią ocenę, liczbę recenzji, obecność zdjęć od klientów i daty najnowszych recenzji.
- Wyciągnij atrybuty tkaniny, pielęgnacji, składu, sezonowości. Dla akcesoriów - rozmiary i materiały, dla obuwia - wkładka, podeszwa, wysokość obcasa itd.
- Pobierz obrazy i, jeśli dostępne, wideo pokazu modelu. Przechowuj w osobnych podfolderach shein_productId.
- Oznacz obecność bundli i „kompletów” z różnymi kombinacjami kolorów i rozmiarów. Rejestruj różnice cenowe według kolorów.
- Zapisz zapis w tabeli: identyfikator, kategoria, cena, zniżka, waluta, warianty, atrybuty, ocena, recenzje, obrazy, data i źródło.
Ważne punkty: Shein często zmienia układ kart w zależności od sezonu i regionu. Porównuj kilka kart z jednej kategorii i zapisuj uniwersalne pola, aby nie być zależnym od projektu.
✅ Sprawdzenie: Tabela z kartami Shein jest wypełniona kluczowymi polami, obrazy zostały pobrane, a tabele rozmiarów zapisane jako pola tekstowe.
Porada: Stwórz pole „style_tags” i ręcznie oznacz kilka elementów trendowej stylistyki, np. „quiet luxury”, „y2k”, „minimal”, „athleisure”. Później pomoże to w skoringu.
Możliwe problemy i rozwiązania
- Niektóre pola znikają przy zmianie regionu → Sprawdź walutę i IP. Jeśli atrybuty zależą od magazynu, rejestruj region w każdym zapisie karty.
- Wideo nie ładuje się → Zapisz link i oznacz status. Wideo można pobrać później, przy następnym przebiegu.
Krok 7: Strukturujemy dane, eliminujemy duplikaty, konfigurujemy przechowywanie
Cel etapu: Uporządkować dane, aby codziennie aktualizować asortyment i poprawnie porównywać historię cen, recenzji i stanów.
Szczegółowa instrukcja
- Stwórz schemat danych: tabela products z polami product_id, source, region, title, brand, category, price, old_price, currency, discount_pct, rating, reviews_count, stock_status, shipping_fee, delivery_eta, attributes, created_at, updated_at, status.
- Dodaj tabelę variants: variant_id, product_id, color, size, price, stock, sku.
- Dodaj tabelę media: media_id, product_id, variant_id, type, url_original, local_path, image_hash, downloaded_at.
- Stwórz tabelę daily_metrics: product_id, date, price_min, price_max, price_med, reviews_total, reviews_delta_7d, rating, rank_in_category.
- Przy ładowaniu nowych danych porównuj product_id i region. Jeśli zapis istnieje, aktualizuj pola i rejestruj updated_at. Jeśli nie - twórz nowy zapis ze statusem „nowa”.
- Sprawdzaj duplikaty przez parę source + product_id + region oraz przez zgodność nagłówka i zestawu obrazów. Przy zgodności oznaczaj „duplikat” i nie twórz nowego zapisu.
- Codziennie twórz snapshot cen i recenzji w daily_metrics do budowania historii.
Ważne punkty: Historia zmian jest ważniejsza niż jednokrotne zestawienie. Nawet jeśli nie zautomatyzowałeś wszystkiego, rób codzienny eksport kluczowych metryk.
✅ Sprawdzenie: W bazie lub tabelach widzisz unikalne produkty bez dubli, jest powiązanie produktów z wariantami i obrazami, a także oddzielne zapisy codziennych metryk z datami.
Porada: Jeśli korzystasz tylko z CSV, trzymaj się takiego samego porządku kolumn i dodaj kolumnę snapshot_date, aby łatwo budować wykresy.
Możliwe problemy i rozwiązania
- Różne identyfikatory jednego produktu z powodu regionów → Użyj złożonego klucza source + region + product_id. Aby połączyć, dodaj pole normalized_title i porównuj podobieństwo.
- Plaiki z obrazami są nadpisywane → Dodawaj sufiks daty lub image_hash do nazwy pliku.
Krok 8: Zbieramy ceny, promocje i dostawę z uwzględnieniem regionów i czasu
Cel etapu: Zapewnić poprawność cen i promocji z odniesieniem do regionu, pory dnia i akcji.
Szczegółowa instrukcja
- Dla każdego rynku wejdź w harmonogram: na przykład dwie chłodzenia w dni robocze i jedna w weekendy, z naciskiem na poranek i wieczór lokalnego czasu.
- Zapisz kurs waluty w momencie parsyngowania, aby przeliczyć ceny na jednolity standard w raportach.
- Skanuj banery promocji i blok kodów promocyjnych na stronie kategorii. Zapisz tekst promocji i datę odkrycia w oddzielnej tabeli promos.
- Dla dostawy zachowaj typ, przybliżony czas, płatność lub darmowość. Staraj się codziennie zwracać uwagę na to, czy dostawa jest darmowa lub zmienił się próg.
- Zbierz historię cen za 7, 14, 30 dni i oblicz minimalną i medianę cen za ten okres dla każdego produktu i wariantu.
Ważne punkty: Niektóre promocje aktywują się dopiero po dodaniu do koszyka. W takim przypadku rejestruj cenę na karcie i oznacz pole cart_price_unknown, aby nie mieszać różnych źródeł ceny.
✅ Sprawdzenie: W raportach pojawiają się ceny, zniżki i dostawa dla każdego regionu, obliczamy minimalne i mediany cen, mamy historię zmian za 7-30 dni.
Porada: Dodaj pole price_confidence: high, medium, low. Jeśli promocja jest niejednoznaczna, oznaczaj low i sprawdzaj ponownie przy następnym biegu.
Możliwe problemy i rozwiązania
- Ceny „skaczą” między biegami → Zwiększ częstotliwość i synchronizuj czas sesji z lokalną strefą czasową docelowego regionu.
- Dostawa nie jest widoczna przed wpisaniem adresu → Zapisuj ogólny zakres i oznacz unknown_address, wykonaj ponowną kontrolę dla popularnych produktów ręcznie.
Krok 9: Znajdujemy zyskowne produkty i prognozujemy popyt
Cel etapu: Przemienić zebrane dane w zrozumiały skoring i prognozę dynamiki popytu, aby szybko wybierać produkty do dropshippingu.
Szczegółowa instrukcja
- Ustal skoring S na podstawie wag: cena ze zniżką, głębokość zniżki, wzrost recenzji 7d, ocena, obecność zdjęć klientów, stabilność dostępności, trendy tagów.
- Normalizuj każdą metrykę w zakresie 0-1. Przykład: ocena 4.8-5.0 zamienia się w 0.96-1.00.
- Oblicz S = w1*discount_depth + w2*reviews_delta_7d + w3*rating + w4*availability + w5*trend_tags + w6*price_position w odniesieniu do mediany w kategorii.
- Stwórz listę topowych produktów na podstawie S dla każdego regionu i kategorii. Porównaj między Temu i Shein, znajdź duplikaty i unikalne odkrycia.
- Dla prognozy popytu wykorzystaj prosty model: ślizgające się średnie przyrostu recenzji i trendy w kategoriach w ciągu ostatnich 14 dni. Oznaczaj produkty z stabilnym wzrostem.
- Dodatkowo uwzględniaj „sezonowość”: etykiety związane ze świętami i porami roku, np. „wiosna-lato”, „prezent na 8 marca”, „powrót do szkoły”.
- Uformuj krótki wykaz z 20-50 produktów o wysokim S i pozytywnej prognozie popytu na 2-4 tygodnie.
Ważne punkty: Unikaj nadmiernego uczenia skoringu na rzadkich wydarzeniach. Sprawdzaj, czy każdy czynnik wnosi sensowny wkład.
✅ Sprawdzenie: Masz tabelę ze wynikami S, listę topowych produktów i prognozę na nadchodzące tygodnie. Metryki regularnie aktualizowane po każdym biegu.
Porada: Dla lepszego zrozumienia dodaj mapę cieplną według czynników skoringowych. To pomoże szybko zobaczyć, za co produkt znalazł się na szczycie.
Możliwe problemy i rozwiązania
- Skoring preferuje bardzo tanie, ale niskiej jakości produkty → Zwiększ wagę ocen i recenzji ze zdjęciami, dodaj filtr według minimalnej ceny i jakości materiałów.
- Prognozy są niestabilne z powodu nieregularnych danych → Zwiększ okno wygładzania i zapewnij stabilne codzienne zbieranie.
Krok 10: Rola mobilnych proxy różnych regionów i jak je poprawnie skonfigurować
Cel etapu: Osiągnąć poprawne wyświetlanie asortymentu, cen i dostawy dla rynków docelowych dzięki inteligentnemu wykorzystaniu mobilnych proxy.
Szczegółowa instrukcja
- Wybierz regiony i operatorów, którzy są istotni dla twoich rynków. Zobacz mapę opóźnień i wskazuj wąskie gardła w trasach.
- Skonfiguruj jednoczesną pracę HTTP(S) i SOCKS5, aby elastycznie dostosować protokół do konkretnego zadania.
- Włącz lepkie sesje na 10-30 minut dla zbiorów kart i krótkie sesje przy masowym ładowaniu list.
- Skonfiguruj rotację wg timera i opcję ręcznej zmiany za pomocą linku lub przez API, aby szybko przywrócić dostęp w przypadku ograniczeń.
- Sprawdź zgodność regionu za pomocą weryfikacji IP i testu DNS. Porównaj walutę i ceny w kartach z oczekiwanymi.
- Rejestruj dla każdej paczki zapytań etykiety region, carrier i session_id, aby później zbierać dane według regionu.
Ważne punkty: Używaj rzeczywistych SIM w mobilnych proxy. To zwiększa prawdopodobieństwo widzenia tego samego ekranu, co pokazują prawdziwi klienci.
✅ Sprawdzenie: Tym samym towar w dwóch regionach wyświetla różne ceny lub warunki dostawy, a to stabilnie się powtarza. Sesje i rotacja są zarządzane przewidywalnie.
Porada: Przechowuj statystyki odmów dla IP i operatorów. Dzięki temu stworzysz białą listę najlepszych tras.
Osobno podkreślamy, że dla zadań parsyngowania i monitorowania trendów dobrze jest używać mobilnych proxy, gdzie jednocześnie dostępne są protokoły HTTP(S) i SOCKS5, jest rotacja według timera, przez API lub linki, szeroki zbiór IP oraz wsparcie dla regionów. W 2026 roku jednym z wygodnych rozwiązań pozostaje serwis MobileProxy.Space z 218+ mln IP w 53+ krajach na rzeczywistych SIM operatorów, całodobowym wsparciem i 3 godzinami darmowego testowania. Dla pierwszego zakupu dostępna jest zniżka 20% przy użyciu kodu promocyjnego YOUTUBE20. Przydadzą się też ich bezpłatne narzędzia: sprawdzenie IP, test DNS Leak, Proxy Checker, kalkulator proxy, mapa opóźnień i generator odcisków przeglądarki.
Krok 11: Automatyzacja codziennych biegów i raportów
Cel etapu: Zorganizować zbieranie danych według harmonogramu, ich oczyszczanie i umieszczanie w raportach bez ręcznego udziału.
Szczegółowa instrukcja
- Stwórz harmonogram: poranny i wieczorny bieg dla każdego regionu i kategorii.
- Dodaj kroki: zapytanie listy → parsyngowanie kart → pobieranie zdjęć → aktualizacja bazy → obliczanie metryk → tworzenie raportów.
- W raportach używaj tabel z wykresami: historia cen, wzrost recenzji, rangi w kategoriach, top pod kątem skoringu S.
- Zachowuj eksport w CSV z datą w nazwie pliku. Przechowuj minimum 90 dni.
- W logach rejestruj czas rozpoczęcia i zakończenia, liczbę udanych kart, liczbę błędów, średnie opóźnienie odpowiedzi.
- Ustaw powiadomienia na wypadek anomalii: skoki odmów, długie opóźnienia, zmiany w strukturze kart.
Ważne punkty: Im prostsza droga danych, tym mniej zakłóceń. Unikaj zbędnych konwersji, przechowuj surowe materiały do ponownej obróbki.
✅ Sprawdzenie: Zgodnie z harmonogramem w odpowiednich godzinach pojawiają się nowe pliki CSV i zaktualizowane wykresy, w logach nie ma anomalii, a procent udanych kart stabilnie przekracza 95%.
Porada: Co tydzień przeprowadź "kontrolną próbkę": ręcznie otwórz 10 kart z raportu i sprawdź zgodność cen i atrybutów.
Krok 12: Weryfikacja wyniku
Lista kontrolna
- Foldery data i logs są wypełnione świeżymi plikami.
- Listy kategorii i karty są zbierane dla każdego regionu.
- Obrazy są pobierane i dostępne lokalnie.
- Historia cen i recenzji jest budowana na 7-30 dni.
- Skoring S i listy topowe są formułowane codziennie.
- Rotacja proxy działa, ceny regionalne są poprawne.
- Raporty są aktualizowane według harmonogramu.
Jak przetestować
- Wybierz 5-10 losowych produktów i porównaj ceny i dostępność z witryną ręcznie.
- Sprawdź zgodność waluty i kosztu dostawy.
- Upewnij się, że dubliki nie powstają podczas ponownego uruchamiania w tym samym dniu.
Wskaźniki sukcesu
- 95%+ kart aktualizuje się bez błędów.
- Zbieżność cen z ręczną kontrolą 98%+.
- Wybierasz 10-20 nowych obiecujących produktów tygodniowo.
✅ Sprawdzenie: Wszystkie punkty listy kontrolnej są realizowane, rozbieżności są minimalne, a raporty pomagają podejmować decyzje dotyczące asortymentu.
Krok 13: Typowe błędy i rozwiązania
- Problem: 403 przy otwieraniu kart. Przyczyna: zbyt wysoka częstotliwość lub niestabilna sesja. Rozwiązanie: zmniejsz tempo, wydłuż sesje, przełącz IP, sprawdź region i nagłówki.
- Problem: 429 i ograniczenia czasowe. Przyczyna: szczyty zapytań. Rozwiązanie: dodaj przerwy, serwisy, rotację według timera i ręczną zmianę w przypadku szczytów błędów.
- Problem: ceny różnią się od oczekiwanych. Przyczyna: nieprawidłowy region lub warunki promocyjne. Rozwiązanie: sprawdź IP, walutę, zanotuj promocję, dodaj kolumnę price_confidence.
- Problem: duplikaty w bazie. Przyczyna: niebrane pod uwagę regiony lub różne ID na liście i karcie. Rozwiązanie: użyj złożonego klucza source + region + product_id, normalizuj nagłówki.
- Problem: obrazy nie pobierają się. Przyczyna: przestarzałe linki CDN. Rozwiązanie: pobierać od razu podczas parsyngowania karty, przechowywać lokalnie, dodawać image_hash.
- Problem: niestabilne zbieranie recenzji. Przyczyna: dynamiczne ładowanie. Rozwiązanie: przechowuj odpowiedzi XHR, powtarzaj zapytanie po krótkiej przerwie, rejestruj total i delta.
- Problem: raporty są „puste” rano. Przyczyna: planer nie działa. Rozwiązanie: sprawdź harmonogram, logi startowe, wolne miejsce na dysku.
Porada: Co miesiąc przeprowadzaj audyt schematu danych: usuwaj zbędne pola, dodawaj brakujące, aby raporty były dokładne i szybkie.
Krok 14: Dodatkowe możliwości
Zaawansowane ustawienia
- Rozszerzony skoring z uwzględnieniem wizualnych tagów: analiza dominujących kolorów, długości nazw, liczby słów kluczowych.
- Sygnalizacja promocji: alerty, gdy cena spadnie poniżej mediany o 20%+
- Oddzielne profile przeglądarki według rynków z unikalnymi ustawieniami języka i formatu dat.
Optymalizacja
- Cache HTML i JSON do ponownej obróbki bez nowych zapytań.
- Zmniejszenie równoległości w godzinach szczytu.
- Hashowanie obrazów, aby kontrolować duplikaty i oszczędzać miejsce.
Co jeszcze można zrobić
- Powiązać twój skoring z katalogiem twojego sklepu i automatycznie dopasowywać karty do testów kampanii reklamowych.
- Wprowadzać ręczne etykiety „wysokiej jakości tkanina” lub „odpowiednie na prezent”, aby uczyć skoring na podstawie twoich preferencji.
- Stworzyć porównanie Temu vs Shein według kategorii i regionów, aby zobaczyć, gdzie ceny lub trendy się różnią.
Jeśli planujesz rozszerzenie na inne regiony, z wyprzedzeniem ocenić dostępność mobilnych IP i stabilność operatorów. Tutaj ponownie pomogą mapa opóźnień, proxy checker i kalkulator kosztów połączeń. W 2026 roku wiele osób wybiera MobileProxy.Space właśnie ze względu na duży zbiór IP, zarządzaną rotację w oparciu o timer, przez API oraz w linku, oraz całodobowe wsparcie. Pamiętaj o kodzie promocyjnym YOUTUBE20, aby uzyskać zniżkę 20% na pierwszy zakup oraz nie zapominaj o korzystaniu z bezpłatnych narzędzi do sprawdzania IP i DNS.
FAQ
- Czy można obejść się bez kodu? Tak, użyj przeglądarki, zapisz HTML i tabele. Ale automatyzacja oszczędza czas i zmniejsza błędy.
- Jak często aktualizować dane? Dla treści trendowych - 1-2 razy dziennie, dla stabilnych - 2-3 razy w tygodniu.
- Co robić, gdy pojawia się kontrola podejrzanej aktywności? Zmniejsz częstotliwość, poczekaj 10-30 minut, zmień IP, powtórz później małymi porcjami.
- Jak poprawnie określić region? Uzgodnij IP i walutę oraz warunki dostawy. Użyj sprawdzania IP i testu DNS, mapy opóźnień w celu określenia tras.
- Jak przechowywać obrazy bez chaosu? Nazwy na podstawie wzoru z product_id i image_hash, foldery według źródła i daty.
- Dlaczego liczby recenzji czasami nie rosną? Może to być sezonowa przerwa lub opóźnienie publikacji recenzji. Obserwuj okna 7- i 14-dniowe.
- Jak uwzględniać różne opcje cenowe? Rejestruj cenę karty i ceny wariantów, w metrykach użyj minimum, maksimum i mediany.
- Czy można bezpośrednio porównywać Temu i Shein? Tak, wg tych samych kategorii i rynków. Normalizuj ceny w jednej walucie i uwzględniaj dostawę.
- Co robić, gdy zmienia się struktura strony? Zaktualizuj zasady zbierania, ponownie sprawdź 10-20 kart ręcznie, zanotuj zmiany w dzienniku.
- Jak szybciej znajdować trendy? Sortuj po wzroście recenzji za 7 dni i głębokości zniżki w odniesieniu do mediany kategorii, a następnie sprawdzaj wizualne tagi trendów.
Podsumowanie
Przeszedłeś pełny cykl: określiłeś cele i metryki, przygotowałeś środowisko, uwzględniłeś cechy antybotowe Temu i Shein, zebrałeś listy kategorii, wyciągnąłeś karty, obrazy i ceny, zestrukturowałeś dane, zautomatyzowałeś codziennie, stworzyłeś skoring i prognozę popytu. Teraz masz stabilny proces, który pomaga znajdować i weryfikować zyskowne produkty dla dropshippingu.
Co robić dalej: rozszerzaj regiony i kategorie, dodawaj cechy do skoringu, poprawiaj jakość prognoz na podstawie historii i nowych czynników. Integruj raporty z twoim sklepem, aby szybciej uruchomić testowe sprzedaże.
Gdzie się rozwijać: pogłębiaj analizy sezonowości, znajdź wczesne sygnały trendów, eksperymentuj z formatami treści kart i wizualnymi tagami. Regularnie sprawdzaj ustawienia mobilnych proxy i regionalne parametry, aby twoje dane zawsze odzwierciedlały rzeczywistą sytuację. Przypominamy, że dla poprawnego wyświetlania cen i asortymentu kluczowa jest sesja w odpowiednim regionie. W tym pomaga mobilne proxy z szeroką geografią, elastyczną rotacją i narzędziami do kontroli. Wśród przydatnych rozwiązań na 2026 rok znajduje się MobileProxy.Space, gdzie dostępne są 218+ mln IP z 53+ krajów, rzeczywiste oparcie na SIM operatorów, jednoczesne wsparcie HTTP(S) i SOCKS5, rotacja według timera, API lub linku, 3 godziny darmowego testu i wsparcie 24/7. Nie zapomnij użyć kodu promocyjnego YOUTUBE20 dla zniżki na pierwsze zakupy.