Temu และ Shein 2026: วิธีการดึงข้อมูลสินค้าและติดตามเทรนด์ — คู่มือทีละขั้นตอน
บทความ
- บทนำ
- การเตรียมตัวเบื้องต้น
- แนวคิดพื้นฐาน
- ขั้นตอนที่ 1: กำหนดเป้าหมายการดึงข้อมูลและเมตริก
- ขั้นตอนที่ 2: เตรียมสภาพแวดล้อมการทำงานและเครือข่าย
- ขั้นตอนที่ 3: เข้าใจฟังก์ชันต่อต้านบอทของ temu และ shein
- ขั้นตอนที่ 4: ดึงข้อมูลสินค้าออกจากรายการหมวดหมู่และการค้นหา
- ขั้นตอนที่ 5: ดึงข้อมูลรายละเอียดสินค้าใน temu
- ขั้นตอนที่ 6: ดึงข้อมูลรายละเอียดสินค้าใน shein
- ขั้นตอนที่ 7: จัดระเบียบข้อมูล, กำจัดข้อมูลซ้ำ, และตั้งค่าการเก็บข้อมูล
- ขั้นตอนที่ 8: รวบรวมราคา, โปรโมชัน และการจัดส่งตามภูมิภาคและเวลา
- ขั้นตอนที่ 9: หาสินค้าที่ได้เปรียบและคาดการณ์ความต้องการ
- ขั้นตอนที่ 10: บทบาทของพร็อกซี่มือถือในภูมิภาคต่าง ๆ และวิธีการตั้งค่าอย่างถูกต้อง
- ขั้นตอนที่ 11: ทำให้งานรวบรวมข้อมูลประจำวันและรายงานเป็นอัตโนมัติ
- ขั้นตอนที่ 12: ตรวจสอบผลลัพธ์
บทนำ
ในคู่มือปฏิบัติการนี้ คุณจะได้ตั้งค่ากระบวนการดึงข้อมูลจาก Temu และ Shein ในปี 2026 ทีละขั้น: ตั้งแต่การตรวจสอบการเชื่อมต่อแรกจนถึงการอัปเดตราคา, รูปภาพ, วาเรียชัน และเมตริกความต้องการรายวัน ท้ายที่สุดคุณจะได้กระบวนการที่สามารถทำซ้ำได้ซึ่งสามารถระบุสินค้าที่มีศักยภาพและคาดการณ์เทรนด์สำหรับดรอปชิปปิ้ง โดยคำนึงถึงนโยบายต่อต้านบอทที่แท้จริงของแพลตฟอร์มและความแตกต่างของราคาในแต่ละภูมิภาค
คู่มือนี้เหมาะสำหรับใคร: สำหรับผู้เริ่มต้นดรอปชิปเปอร์, นักการตลาด, นักวิเคราะห์ และเจ้าของร้านค้าออนไลน์ขนาดเล็ก สื่อได้รับการออกแบบมาเพื่อให้คุณสามารถบรรลุผลโดยไม่จำเป็นต้องมีความรู้ด้านการเขียนโปรแกรมลึก ๆ ขณะเดียวกันก็รวมบล็อกที่มีฟังก์ชันที่ก้าวหน้าสำหรับการขยายตัว
สิ่งที่คุณควรรู้ล่วงหน้า: การใช้งานเบื้องต้นกับเบราว์เซอร์, ความเข้าใจเกี่ยวกับพร็อกซี่และทำไมภูมิภาคถึงสำคัญสำหรับราคาของ Temu และ Shein หากคุณเคยได้ยินเกี่ยวกับ JSON, คุกกี้ และเฮดเดอร์ จะทำให้เข้าใจได้ง่ายขึ้น แต่ไม่จำเป็น เราจะอธิบายคำศัพท์ที่สำคัญทั้งหมด
เวลาที่ต้องใช้: การตั้งค่าพื้นฐานใช้เวลา 3-4 ชั่วโมง, การทดลองข้อมูลที่มั่นคงครั้งแรกใช้เวลา 1 วันทำงาน, การทำให้เป็นอัตโนมัติและรายงานใช้เวลา 1-2 วัน การใช้งานเต็มรูปแบบ — ด้วยการอัปเดตรายวัน — จะเริ่มให้ประโยชน์ในสัปดาห์แรก
การเตรียมตัวเบื้องต้น
ก่อนเริ่ม ให้รวบรวมเครื่องมือและสร้างสภาพแวดล้อมที่ปลอดภัย จะช่วยลดข้อผิดพลาดและเร่งความเร็วในการทำงาน
เครื่องมือที่จำเป็น
- เว็บเบราว์เซอร์ที่ทันสมัยพร้อมโหมดนักพัฒนา
- โปรแกรมแก้ไขข้อความหรือสเปรดชีตสำหรับบันทึกการตั้งค่าและผลลัพธ์
- เครื่องมือจัดการงานสำหรับวางแผนการทดลองข้อมูลประจำวัน
- ที่เก็บข้อมูล: โฟลเดอร์ท้องถิ่นสำหรับรูปภาพและ CSV, ควรเชื่อมต่อกับฐานข้อมูล
- พร็อกซี่ที่มี IP มือถือสำหรับการเข้าถึงที่มั่นคงไปยัง Temu และ Shein ในภูมิภาคที่ต้องการ
ความต้องการของระบบ
- OS: Windows 10/11, macOS 12+, หรือ Linux ที่รองรับ
- RAM: อย่างน้อย 8 GB, สำหรับงานหลายอย่างพร้อมกันควรมี 16 GB
- พื้นที่ว่าง: 10-50 GB สำหรับรูปภาพและบันทึกการเข้าชม
- อินเทอร์เน็ตที่เชื่อถือได้ 20+ Mbps สำหรับการโหลดสื่ออย่างมีเสถียรภาพ
สิ่งที่ต้องติดตั้งและตั้งค่า
- เบราว์เซอร์ที่เปิดใช้งานโหมดนักพัฒนา ตรวจสอบแถบเครือข่ายและที่เก็บข้อมูล
- โปรแกรมวางแผนงาน: โปรแกรมวางแผนในตัวของ OS หรือโปรแกรมขอแนะนำใด ๆ
- เครื่องมือการตรวจสอบเครือข่าย: การตรวจสอบ IP, DNS Leak Test, Proxy Checker, แผนที่ความล่าช้า, เครื่องคิดเลขพร็อกซี่, เจนเนอเรเตอร์ลายนิ้วมือในเบราว์เซอร์ เครื่องมือฟรีเหล่านี้จะช่วยให้คุณมั่นใจได้ว่าคุณเห็นราคาในภูมิภาคที่ถูกต้อง
- โฟลเดอร์โปรเจ็ค: data/raw สำหรับ HTML และ JSON ดั้งเดิม, data/images สำหรับรูปภาพ, data/csv สำหรับการอัปโหลด, logs สำหรับบันทึกคำขอ
การสำรองข้อมูล
- ทุกวันให้ทำการสำรองโฟลเดอร์ data และ logs ลงในไฟล์เก็บถาวรที่แยกต่างหาก
- สำหรับ CSV ใช้สำเนาที่มีวันที่ในชื่อ
- หากคุณใช้ฐานข้อมูลให้ตั้งค่าการทำ dump ทุกวัน
✅ การตรวจสอบ: คุณต้องมีโครงสร้างโฟลเดอร์ที่ใช้งานได้คือ data/raw, data/images, data/csv และ logs, การเข้าถึงเครื่องมือการตรวจสอบ IP และความล่าช้า และแผนการทดลองครั้งแรกที่บันทึกไว้
เคล็ดลับ: บันทึกการกระทำตั้งแต่แรก: วันที่, สิ่งที่ทำ, สิ่งที่เปลี่ยนแปลง, ข้อผิดพลาดที่เกิดขึ้น จะประหยัดชั่วโมงในการแก้ไข
แนวคิดพื้นฐาน
คำศัพท์สำคัญอธิบายอย่างง่าย
- ข้อมูลสินค้า: หน้าเว็บหรือข้อมูลที่มีชื่อ, ราคา, รูปภาพ, ขนาด, สี, คะแนนและฟิลด์อื่น ๆ
- เซสชั่น: ระยะเวลาการทำงานต่อเนื่องบนเว็บไซต์จาก IP และโปรไฟล์เบราว์เซอร์เดียวกัน
- การหมุนเวียน IP: การเปลี่ยน IP โดยอัตโนมัติในทุกระยะเวลาที่กำหนด
- ราคาในภูมิภาค: ราคาที่ขึ้นอยู่กับประเทศ, เมือง หรือผู้ให้บริการ
- ต่อต้านบอท: กลไกที่ระบุพฤติกรรมที่น่าสงสัยและจำกัดการเข้าถึง
หลักการพื้นฐาน
- ทำการร้องขอน้อยในช่วงเวลาสั้น ๆ และรักษาเซสชั่นที่เสถียร
- ปฏิบัติตาม robots.txt และเงื่อนไขการใช้งานของแพลตฟอร์ม
- เก็บข้อมูลดิบ: HTML, JSON จากการตอบกลับ, ตราเวลา
- ตรวจสอบภูมิภาคของราคาในท้องถิ่นเสมอโดยใช้การตรวจสอบ IP และแผนที่ความล่าช้า
สิ่งที่สำคัญต้องเข้าใจ
- Temu และ Shein แสดงสินค้และราคาแตกต่างกันสำหรับภูมิภาคและอุปกรณ์ที่แตกต่างกัน การใช้ IP มือถือตช่วยให้เห็นราคาเดียวกันที่ผู้ซื้อจริงเห็นจากสมาร์ทโฟน
- อินเทอร์เฟซอาจโหลดข้อมูลแบบไดนามิก บางครั้งข้อมูลสินค้าอาจมาจาก JSON แทนที่จะแสดงใน HTML แบบคงที่
- ความถี่ในการอัปเดตสำคัญ: เทรนด์มีอายุสั้น
เคล็ดลับ: ก่อนที่จะขยายการรวบรวมข้อมูล ควรทำวงจรหนึ่งด้วยตนเอง: เปิดหมวดหมู่, กรองสินค้า, เข้าดู 5-10 ข้อมูลและบันทึกฟิลด์ที่คุณเห็น
ขั้นตอนที่ 1: กำหนดเป้าหมายการดึงข้อมูลและเมตริก
เป้าหมายของขั้นตอน: สร้างรายการข้อมูลที่ชัดเจนที่คุณจะรวบรวม และเข้าใจว่าจะประเมินความต้องการและเทรนด์อย่างไร
คำแนะนำโดยละเอียด
- กำหนดตลาด: เช่น EU, สหรัฐอเมริกา หรือประเทศเฉพาะ บันทึกลำดับความสำคัญตามสกุลเงินและภาษา
- เลือกหมวดหมู่: เสื้อผ้าสตรี, อุปกรณ์เสริม, สินค้าบ้าน, อุปกรณ์อิเล็กทรอนิกส์ ฯลฯ เริ่มจาก 1-2 หมวดเพื่อเร่งกระบวนการดีบัก
- จัดทำรายการฟิลด์ของข้อมูลสินค้า: ชื่อ, แบรนด์, หมายเลขสินค้า, หมวดหมู่, หมวดย่อย, ราคา, ราคาก่อนหน้า, ส่วนลดเป็นเปอร์เซ็นต์, สกุลเงิน, สถานะ, ระยะเวลาจัดส่ง, ค่าจัดส่ง, คะแนน, จำนวนรีวิว, จำนวนคำสั่งซื้อ, รูปภาพ, วิดีโอ, ตัวเลือกขนาดและสี, คุณสมบัติของวัสดุ, ขนาดบรรจุภัณฑ์, น้ำหนัก, คำหลัก, แท็ก, วันที่ตรวจพบ
- กำหนดเมตริกเสริมสำหรับความต้องการ: ความผันผวนของราคาใน 7 และ 30 วัน, การเพิ่มจำนวนรีวิวใน 7 วัน, ความเร็วในการปรากฏของรูปภาพใหม่จากผู้ซื้อ, อันดับสัมพัทธ์ในหมวดหมู่
- บันทึก KPI: ความถูกต้องของการดึงข้อมูล 98%+, สัดส่วนข้อมูลที่สำเร็จ 95%+, ความคงที่ในการอัปเดตประจำวัน 99%+
ประเด็นสำคัญ: ยิ่งฟิลด์ถูกกำหนดไว้อย่างแม่นยำมากเท่าไร ยิ่งง่ายต่อการตรวจสอบและแก้ไขข้อผิดพลาด รายการฟิลด์ควรเก็บไว้ในเอกสารแยกต่างหาก
✅ การตรวจสอบ: คุณมีเอกสารที่มีรายการตลาดเป้าหมาย, หมวดหมู่, ฟิลด์ของข้อมูลสินค้า และเมตริก รวมถึงตาราง KPI
เคล็ดลับ: เพิ่มฟิลด์ "สถานะของข้อมูล": ใหม่, อัปเดต, ถูกลบ, หรือซ่อน ซึ่งจะช่วยให้เปรียบเทียบระหว่างวันได้ง่าย
ปัญหาที่อาจเกิดขึ้นและทางแก้ไข
- จำนวนฟิลด์มากเกินไปทำให้สับสน → ลดให้เหลือน้อยที่สุดและเพิ่มตามความจำเป็น
- ไม่แน่ใจว่าจะวัดความต้องการอย่างไร → เริ่มจากการเพิ่มจำนวนรีวิวและอันดับสัมพัทธ์ในหมวดหมู่
ขั้นตอนที่ 2: เตรียมสภาพแวดล้อมการทำงานและเครือข่าย
เป้าหมายของขั้นตอน: ตั้งค่าการเชื่อมต่อเครือข่ายที่เสถียรและสภาพแวดล้อมให้กับหน้า Temu และ Shein เพื่อแสดงราคาที่ถูกต้องในภูมิภาคและไม่มีข้อผิดพลาด
คำแนะนำโดยละเอียด
- สร้างโปรไฟล์เบราว์เซอร์ "temu-shein-2026" และเปิดใช้งานโหมดนักพัฒนา
- เชื่อมต่อพร็อกซี่มือถือในภูมิภาคที่ต้องการ ระบุโปรโตคอล HTTP(S) หรือ SOCKS5
- ตรวจสอบ IP และภูมิภาคโดยใช้เครื่องมือการตรวจสอบ IP และแผนที่ความล่าช้า ให้แน่ใจว่าประเทศและเมืองตรงกับตลาดเป้าหมาย
- เปิดใช้งาน DNS Leak Test เพื่อให้แน่ใจว่าการตั้งค่าเครือข่ายของคุณสอดคล้องกัน
- เปิดหน้าแรกของ Temu ดูสกุลเงิน, ภาษา, แบนเนอร์การจัดส่ง และตรวจสอบให้แน่ใจว่าสอดคล้องกับภูมิภาคที่เลือก
- เปิด Shein แล้วทำการตรวจสอบซ้ำเทียบสกุลเงินและค่าจัดส่ง
- ตั้งค่าการหมุนเวียน IP ตามเวลาที่กำหนด เช่น ทุก 15-30 นาที และตั้งค่าให้สามารถเปลี่ยนแบบแมนนวลได้ผ่านลิงค์หรือ API สำหรับการกู้คืนได้อย่างรวดเร็วในกรณีที่เกิดข้อผิดพลาด
- ตรวจสอบความเสถียร: เปิดดูข้อมูล 5-7 รายการจากหมวดหมู่เดียว ตรวจสอบให้แน่ใจว่าสกุลเงินและแพทเทิร์นของราคาเป็นไปในทิศทางเดียวกัน
ประเด็นสำคัญ: สำหรับการดึงข้อมูลอย่างถูกต้อง สำคัญมากที่จะต้องใช้ IP มือถือจริงและรักษา "เซสชั่นติด" 10-30 นาทีสำหรับความสอดคล้องของข้อมูล งานที่ไม่ต้องการความยุ่งยากสามารถอัปเดตได้เมื่อมีการเปลี่ยน IP
⚠️ ข้อควรระวัง: ปฏิบัติตามเงื่อนไขการใช้งานของแพลตฟอร์มทั้งหมดและมาตรฐานจริยธรรมในการรวบรวมข้อมูล การร้องขอที่มากเกินไปอาจทำให้ถูกจำกัด ดังนั้นควรทดสอบโหลดที่จำนวนไม่มาก
✅ การตรวจสอบ: ราคาสและสกุลเงินของทั้งสองแพลตฟอร์มต้องตรงกับภูมิภาคที่ตั้งใจ DNS test ต้องสะอาด ความล่าช้าต่อภูมิภาคต้องอยู่ในระดับที่ยอมรับได้จากแผนที่ความล่าช้า การหมุนเวียน IP ทำงานอัตโนมัติตามเวลาที่กำหนดและแบบแมนนวล
เคล็ดลับ: หากคุณมีหลายภูมิภาคให้สร้างโปรไฟล์เบราว์เซอร์แยกต่างหากและการตั้งค่าการหมุนเวียนแยกต่างหากสำหรับแต่ละภูมิภาค เพื่อช่วยลดความสับสน
ขั้นตอนที่ 3: เข้าใจฟังก์ชันต่อต้านบอทของ Temu และ Shein
เป้าหมายของขั้นตอน: สร้างรูปแบบการทำงานที่ปลอดภัยเพื่อหลีกเลี่ยงการกระทำที่น่าสงสัยและได้รับตัวอย่างข้อมูลที่เสถียร
คำแนะนำโดยละเอียด
- ตั้งค่าขีดจำกัดพื้นฐาน: ไม่เกิน 1-2 การร้องขอในวินาทีต่อโดเมนในช่วงพีค แต่ควรทำให้สม่ำเสมอ 1 การร้องขอทุกๆ 1-2 วินาทีต่อการไหล
- ใช้เซสชั่นที่เสถียร: โปรไฟล์เดียวกัน, เฮดเดอร์และภาษาของอินเทอร์เฟซที่เหมือนกันสำหรับการร้องขอลำดับ
- เลียนแบบพฤติกรรมที่เหมือนจริง: เปิดรายการก่อนแล้วไปที่ข้อมูลสินค้า เลื่อนดูรูปภาพ และเว้นระยะพักขนาดเล็ก 1-4 วินาที
- ตรวจสอบการตอบกลับจากเซิร์ฟเวอร์: รหัส 200, 301-302, 403, 429 หากเป็น 429 ให้หยุด 2-5 นาทีและเปลี่ยน IP โดยการหมุนแบบแมนนวล หากเป็น 403 ให้ลดความถี่หรืเปลี่ยนภูมิภาค
- บันทึกคุกกี้และที่เก็บข้อมูลท้องถิ่นในระหว่างเซสชั่นติด และอัปเดตเฉพาะเมื่อเริ่มเซสชั่นใหม่
ประเด็นสำคัญ: Temu และ Shein เปลี่ยนอินเทอร์เฟซและวิธีการโหลดโดยไดนามิก หากจะแก้ไขให้เข้ากับ ควรตรวจสอบอินเทอร์เฟซด้วยตนเองทุกสัปดาห์และปรับปรุงคำแนะนำการรวบรวมที่ฟิลด์
✅ การตรวจสอบ: ระหว่างการเข้าใช้งานด้วยความเร็วที่เสถียร คุณสามารถเปิดดูข้อมูลสินค้า 10-20 รายการติดต่อกันโดยไม่มีการตรวจสอบที่ไม่คาดคิด ราคาและภาษาไม่ "กระโดด" รหัสการตอบกลับ 200 ต้องมีความเสถียร
เคล็ดลับ: หากคุณทำงานในชุด ควรทำชุดสั้นๆ โดย 50-100 ข้อมูลสินค้า โดยเว้นระยะหยุด 5-10 นาทีระหว่างชุด เพื่อเพิ่มความเสถียร
ขั้นตอนที่ 4: ดึงข้อมูลสินค้าออกจากรายการหมวดหมู่และการค้นหา
เป้าหมายของขั้นตอน: รวบรวมลิสต์ลิงค์สินค้าที่เสถียรตามหมวดหมู่และการค้นหาที่เลือกพร้อมพิจารณาการจัดเรียงและตัวกรอง
คำแนะนำโดยละเอียด
- กำหนดแหล่งข้อมูลของรายการ: หมวดหมู่, การคัดเลือก "สินค้าใหม่", "สินค้าขายดี", "ส่วนลด" หรือคำค้นหาตามคำหลัก
- เปิดหน้าหมวดหมู่ของ Temu เปิดโหมดนักพัฒนาและตรวจสอบแถบเครือข่ายเพื่อดูว่ารายการโหลดผ่าน API JSON หรือ HTML โดยตรง บันทึก URL และพารามิเตอร์
- เลื่อนหน้าจนสุดเพื่อโหลดข้อมูลทั้งหมดในรายการ ทำอย่างค่อยเป็นค่อยไปและเว้นระยะเพื่อไม่ให้เกิดการโหลดจนมีความพลุ่งพล่าน
- บันทึก HTML ของหน้าและการตอบกลับ JSON ในโฟลเดอร์ data/raw พร้อมวันที่และเวลา
- ทำตามขั้นตอนเดียวกันใน Shein ตรวจสอบการจัดเรียงตาม "ความใหม่", "ความนิยม" และ "ราคา"
- ทำการโหลดลิงค์ข้อมูลสินค้า: ดึงรหัสสินค้า, URL ข้อมูลสินค้าและพารามิเตอร์ที่มองเห็นได้แรก ๆ เช่นราคาและส่วนลดจาก snippet
- แบ่งรายการสุดท้ายจากแต่ละหมวดหมู่เป็นชุดขนาด 50-100 ลิงค์
ประเด็นสำคัญ: สำคัญมากที่จะต้องบันทึกการจัดเรียงและตัวกรองให้ตรง น้ำหนักของเทรนด์และลำดับการให้บริการ สำหรับการทำซ้ำรายวัน ให้ใช้พารามิเตอร์เดียวกัน
⚠️ ข้อควรระวัง: อย่าทำการโหลดรายการขนานหลายชุดในเวลาเดียวกัน จังหวะนั้นสำคัญกว่าความจุ ทำการส่งข้อมูลซ้ำบ่อยขึ้น แต่ในปริมาณที่น้อย
✅ การตรวจสอบ: คุณมีไฟล์ที่มีลิงค์ข้อมูลและรหัสสินค้าสำหรับแต่ละหมวดหมู่ของ Temu และ Shein ในโฟลเดอร์ data/raw บันทึก HTML และ JSON มีวันที่ที่บันทึกไว้
เคล็ดลับ: เพิ่มฟิลด์ "source_tag" สำหรับแต่ละชุด เช่น temu_cat_women_dresses_popular_2026-03-10_10-30 เพื่อช่วยติดตามว่าสินค้าแต่ละชิ้นมีแหล่งมาจากการแสดงผลแบบไหน
ปัญหาที่อาจเกิดขึ้นและทางแก้ไข
- สินค้าบางชิ้นไม่โหลดเมื่อเลื่อน → เพิ่มระยะเวลาก่อนที่จะเลื่อนช้า ลดความเร็วในการเลื่อน และตรวจสอบสถานะ XHR โดยใช้แถบเครือข่าย
- รายการส่งกลับเป็นค่าว่าง → ตรวจสอบภูมิภาค, สกุลเงิน และ IP หากไม่เข้ากับภูมิภาค หน้าอาจมีการกรองสินค้า
ขั้นตอนที่ 5: ดึงข้อมูลรายละเอียดสินค้าใน Temu
เป้าหมายของขั้นตอน: เรียนรู้วิธีการดึงข้อมูลฟิลด์สำคัญทั้งหมดในรายละเอียดสินค้า Temu อย่างเสถียร รวมถึงตัวเลือก, รูปภาพและราคา
คำแนะนำโดยละเอียด
- เปิดข้อมูลแรกของสินค้าในรายการ Temu บันทึกโครงสร้าง: ชื่อ, บล็อกราคา, ราคาก่อนหน้า, ร้อยละของส่วนลด, การเลือกตัวเลือก
- ตรวจสอบว่ารูปภาพโหลดขนาดไหน: มักจะมี URL ที่แตกต่างกันระหว่างขนาดย่อและขนาดจริง คลิกที่รูปภาพดูการเรียก API ที่ CDN และบันทึกลิงค์ไปยังขนาดที่จริง
- ดึงเมตาดาต้า: แบรนด์, หมายเลขสินค้า, วัสดุ, ขนาด, น้ำหนัก, ข้อมูลการจัดส่งและการคืนสินค้า หลายค่าซ่อนอยู่ในส่วนหรือแท็บอื่น ให้เลื่อนลงไปมากขึ้น
- รวบรวมข้อมูลเกี่ยวกับตัวเลือก: สี, ขนาด, รหัสตัวเลือก, ความพร้อมสต็อก, ความแตกต่างในราคา
- บันทึกคะแนนและรีวิว: คะแนนเฉลี่ย, จำนวนรีวิว, การมีรูปภาพจากผู้ซื้อ, วันที่ของรีวิวล่าสุด
- บันทึกฟิลด์ที่พบทั้งหมดในบันทึกชั่วคราว: ชื่อ, หมวดหมู่, ราคา, ราคาก่อนหน้า, สกุลเงิน, ส่วนลด, รหัสสินค้า, URL ข้อมูลสินค้า, URL รูปภาพ, รายการตัวเลือกพร้อมราคาและสต็อก
- ดาวน์โหลดรูปภาพใน data/images โดยใช้ชื่อไฟล์ที่มีความหมาย: temu_productId_main_1.jpg, temu_productId_variant_blue_1.jpg และเก็บไว้ในตารางการจับคู่ระหว่าง productId กับชื่อไฟล์ในเครื่อง
ประเด็นสำคัญ: บางข้อมูลใน Temu อาจโหลดบล็อคผ่านคำขอไดนามิก ดังนั้นควรเก็บข้อมูลดิบ JSON ไว้ใน data/raw เพื่อช่วยในการประมวลผลซ้ำโดยไม่ต้องร้องขอใหม่อีกครั้งจากเว็บไซต์
✅ การตรวจสอบ: คุณมีฟิลด์ข้อมูลผลิตภัณฑ์ Temu ครบถ้วนใน CSV หรือสเปรดชีต และโฟลเดอร์รูปภาพเก็บรูปภาพที่มีคุณภาพตามที่ต้องการ รหัสและลิงค์สอดคล้องกัน
เคล็ดลับ: เพิ่มฟิลด์ "image_hash" สำหรับรูปภาพแต่ละเฉพาะ เพื่อใช้ในการติดตามการเปลี่ยนภาพและหาซ้ำ
ปัญหาที่อาจเกิดขึ้นและทางแก้ไข
- ราคาจะเปลี่ยนเมื่อเลือกตัวเลือก → บันทึกราคาเบื้องต้นของข้อมูลสินค้านั้นและราคาของแต่ละตัวเลือกอย่างแยกต่างหาก ในการรายงานให้แสดงให้เห็นราคาต่ำสุด, สูงสุด และราคาเฉลี่ย
- ลิงค์ไปยังรูปภาพหมดอายุ → ดาวน์โหลดทันทีและเก็บไว้ในพื้นที่เครื่องในการรายงานให้ใช้เส้นทางในเครื่อง
ขั้นตอนที่ 6: ดึงข้อมูลรายละเอียดสินค้าใน Shein
เป้าหมายของขั้นตอน: เรียนรู้วิธีดึงข้อมูลฟิลด์สำคัญในรายละเอียดผลิตภัณฑ์ของ Shein โดยคำนึงถึงคุณสมบัติที่เฉพาะของหมวดหมู่แฟชั่น
คำแนะนำโดยละเอียด
- เปิดข้อมูลของ Shein บันทึกชื่อ, แบรนด์ Shein หรือของบุคคลที่สาม, แท็กการโปรโมชัน, ราคาก่อนหน้าและราคาปัจจุบัน
- ตรวจสอบบล็อกขนาด: สำหรับเสื้อผ้ามักจะมีตารางขนาดและคำแนะนำเกี่ยวกับการใส่ กรุณาบันทึกตารางขนาดในฟิลด์แยกต่างหาก
- เลื่อนลงมาที่รีวิว: บันทึกคะแนนเฉลี่ย, จำนวนรีวิว, รูปภาพผู้ซื้อและวันที่ของรีวิวล่าสุด
- ดึงคุณสมบัติของเนื้อผ้า, การดูแล, ส่วนผสม, และฤดูกาล สำหรับอุปกรณ์เสริม - ขนาดและวัสดุ, สำหรับรองเท้า - ความสูงของส้น, ความกว้างของพื้นรองเท้า ฯลฯ
- ดาวน์โหลดรูปภาพและถ้ามีให้บันทึกวิดโอโชว์แบบจำลอง เก็บไว้ในโฟลเดอร์ shein_productId
- บันทึกการมีบันเดิ้ลและ "ชุด" ที่มีการรวมกันที่แตกต่างกันของสีและขนาด บันทึกความแตกต่างในราคาเมื่อเปลี่ยนสี
- บันทึกข้อมูลในตาราง: รหัส, หมวดหมู่, ราคา, ส่วนลด, สกุลเงิน, ตัวเลือก, คุณสมบัติ, คะแนน, รีวิว, รูปภาพ, วันที่ และแหล่งข้อมูล
ประเด็นสำคัญ: Shein มักจะเปลี่ยนรูปลักษณ์ของรายละเอียดสินค้าให้ขึ้นอยู่กับฤดูกาลและภูมิภาค จึงควรเปรียบเทียบสินค้าหลายชิ้นในหมวดเดียวกันและบันทึกฟิลด์พื้นฐานเพื่อไม่ให้ขึ้นอยู่กับการออกแบบ
✅ การตรวจสอบ: ตารางของข้อมูลผลิตภัณฑ์ Shein มีฟิลด์สำคัญบันทึกไว้อย่างครบถ้วน รูปภาพถูกดาวน์โหลด ตารางขนาดถูกบันทึกไว้ในฟิลด์ข้อความ
เคล็ดลับ: สร้างฟิลด์ "style_tags" และทำการทำคะแนนด้วยตนเองในบางแรลลี่แฟชั่น เช่น "quiet luxury", "y2k", "minimal", "athleisure" จะช่วยในกระบวนการวิเคราะห์ในอนาคต
ปัญหาที่อาจเกิดขึ้นและทางแก้ไข
- บางฟิลด์หายไปเมื่อเปลี่ยนภูมิภาค → ตรวจสอบสกุลเงินและ IP หากอัตโนมัติขึ้นอยู่กับสต๊อก ให้บันทึกภูมิภาคในแต่ละระเบียนของข้อมูลสินค้า
- วิดีโอไม่ดาวน์โหลด → บันทกลิงค์และบันทึกสถานะ วิดีโอจะสามารถดาวน์โหลดได้ในภายหลังในรอบถัดไป
ขั้นตอนที่ 7: จัดระเบียบข้อมูล, กำจัดข้อมูลซ้ำ, และตั้งค่าการเก็บข้อมูล
เป้าหมายของขั้นตอน: ทำให้ข้อมูลมีระเบียบ เพื่อทำการอัปเดตรายการสินค้าอย่างสม่ำเสมอและทำการเปรียบเทียบประวัติราคาที่ถูกต้อง, รีวิวและสต็อก
คำแนะนำโดยละเอียด
- สร้างแบบแผนข้อมูล: ตาราง products โดยมีฟิลด์ product_id, source, region, title, brand, category, price, old_price, currency, discount_pct, rating, reviews_count, stock_status, shipping_fee, delivery_eta, attributes, created_at, updated_at, status
- เพิ่มตาราง variants: variant_id, product_id, color, size, price, stock, sku
- เพิ่มตาราง media: media_id, product_id, variant_id, type, url_original, local_path, image_hash, downloaded_at
- สร้างตาราง daily_metrics: product_id, date, price_min, price_max, price_med, reviews_total, reviews_delta_7d, rating, rank_in_category
- เมื่อโหลดข้อมูลใหม่ให้เปรียบเทียบ product_id และ region หากมีระเบียนอยู่แล้วให้ทำการปรับปรุงฟิลด์และบันทึก updated_at หากไม่มีให้สร้างระเบียนใหม่โดยตั้งสถานะว่า "ใหม่"
- ตรวจสอบการซ้ำซ้อนโดยใช้คู่ source + product_id + region, และการเปรียบเทียบระหว่างชื่อและชุดรูปภาพ หากตรงให้ระบุว่า "ซ้ำ" และไม่ต้องสร้างระเบียนใหม่
- จัดทำ snapshot ประจำวันสำหรับราคาและรีวิวใน daily_metrics เพื่อสร้างประวัติ
ประเด็นสำคัญ: ประวัติการเปลี่ยนแปลงมีความสำคัญมากกว่าการตัดค่าสักครั้ง แม้ว่าคุณจะยังไม่ได้ทำให้เป็นอัตโนมัติในทุก ๆ สถานการณ์ก็ควรทำการส่งออกเมตริกที่สำคัญในแต่ละวัน
✅ การตรวจสอบ: ในฐานข้อมูลหรือตารางคุณจะเห็นสินค้าที่ไม่ซ้ำกัน ไม่มีการซ้ำซ้อน มีความเชื่อมโยงระหว่างสินค้ากับตัวเลือกและภาพถ่าย รวมถึงระเบียนที่แยกออกสำหรับเมตริกประจำวันด้วยวันที่
เคล็ดลับ: หากคุณกำลังใช้งานเพียง CSV ควรรักษาลำดับคอลัมน์ให้เหมือนกันและเพิ่มคอลัมน์ snapshot_date เพื่อให้สามารถสร้างกราฟได้ง่าย
ปัญหาที่อาจเกิดขึ้นและทางแก้ไข
- รหัสสินค้าที่แตกต่างกันจากภูมิภาคเดียวกัน → ใช้คีย์ขนาดใหญ่ source + region + product_id สำหรับการเชื่อมต่อ เพิ่มฟิลด์ normalized_title และเปรียบเทียบความคล้ายคลึงกัน
- ไฟล์รูปภาพที่ถูกเขียนทับ → เพิ่ม suffix วันที่หรือ image_hash ไปในชื่อไฟล์
ขั้นตอนที่ 8: รวบรวมราคา, โปรโมชัน และการจัดส่งตามภูมิภาคและเวลา
เป้าหมายของขั้นตอน: รับประกันราคาถูกต้องและโปรโมชั่นที่เชื่อมโยงกับภูมิภาค, เวลาในระยะวันและโปรโมชั่น
คำแนะนำโดยละเอียด
- สำหรับแต่ละตลาดตั้งตารางเวลา เช่น สองรอบในวันทำงานและหนึ่งรอบในวันหยุด โดยเน้นที่เช้าที่สุดและเย็นในเวลาในท้องถิ่น
- บันทึกค่าเงิน ณ ขณะนั้นในการดึงข้อมูล เพื่อทำให้ราคากลายเป็นมาตรฐานเดียวกันในรายงาน
- สแกนแบนเนอร์โปรโมชั่น และบล็อกโค้ดโปรโมชั่นในหน้าหมวดหมู่ เก็บข้อมูลของข้อความโปรโมชั่นและวันที่ค้นพบลงในตาราง promos
- สำหรับการจัดส่ง ให้บันทึกประเภท, เวลาที่ประมาณการ, ค่าธรรมดาหรือเป็นศูนย์ พยายามตรวจสอบว่ามีการจัดส่งฟรีหรือไม่ในแต่ละวัน
- รวบรวมประวัติราคาใน 7, 14, 30 วัน, และคำนวณราคาต่ำสุดและราคามาตรฐานสำหรับแต่ละสินค้และตัวเลือก
ประเด็นสำคัญ: บางโปรโมชั่นจะทำงานเฉพาะเมื่อมีการเพิ่มเข้าตะกร้า ในกรณีนี้ให้บันทึกราคาที่ข้อมูลสินค้าและทำเครื่องหมายในฟิลด์ cart_price_unknown เพื่อไม่ให้ราคาจากแหล่งที่มาแตกต่างกัน
✅ การตรวจสอบ: ในรายงานมีการแสดงราคา, ส่วนลด และการจัดส่งตามแต่ละภูมิภาค คำนวณราคาต่ำสุดและราคามาตรฐาน มีประวัติการเปลี่ยนแปลงใน 7-30 วัน
เคล็ดลับ: เพิ่มฟิลด์ price_confidence: high, medium, low หากโปรโมชั่นไม่ได้เด่นชัด ให้ทำเครื่องหมายเป็น low และตรวจสอบในรอบถัดไป
ปัญหาที่อาจเกิดขึ้นและทางแก้ไข
- ราคา "กระโดด" ระหว่างการทำโปรแกรม → ปรับความถี่ให้สูงขึ้นและดำเนินการซิงค์เวลาเซสชั่นในเขตเวลาท้องถิ่นของภูมิภาคที่ตั้งใจ
- ค่าจัดส่งไม่แสดงจนกว่าจะป้อนที่อยู่ → บันทึกช่วงทั่วไปและทำเครื่องหมาย unknown_address ตรวจสอบสินค้าที่ได้รับความนิยมด้วยมือ
ขั้นตอนที่ 9: หาสินค้าที่ได้เปรียบและคาดการณ์ความต้องการ
เป้าหมายของขั้นตอน: แปลงข้อมูลที่รวบรวมได้ให้เป็นการให้คะแนนที่เข้าใจได้ และคาดการณ์แนวโน้มความต้องการ เพื่อทำการตัดสินใจซื้อสำหรับดรอปชิป
คำแนะนำโดยละเอียด
- กำหนดการให้คะแนน S ตามน้ำหนัก: ราคาที่ถูกต้อง, ความลึกของการลดราคา, เพิ่มจำนวนรีวิวใน 7 วัน, คะแนน, ความพร้อมของภาพจากผู้ซื้อ, ความเสถียรของสต๊อก, แท็กยอดนิยม
- ปรับน้ำหนักแต่ละเมตริกให้อยู่ในช่วง 0-1 เช่น คะแนน 4.8-5.0 จะกลายเป็น 0.96-1.00
- คำนวณ S = w1*discount_depth + w2*reviews_delta_7d + w3*rating + w4*availability + w5*trend_tags + w6*price_position ที่สัมพันธ์กับราคาเฉลี่ยในหมวดหมู่
- สร้างรายการสินค้าท็อปของ S สำหรับแต่ละภูมิภาคและหมวดหมู่ เปรียบเทียบระหว่าง Temu และ Shein ค้นหาสินค้าที่ซ้ำกันและค้นหาไอเท็มที่เป็นเอกลักษณ์
- สำหรับการคาดการณ์ความต้องการใช้โมเดลง่าย ๆ: ค่าเฉลี่ยเคลื่อนที่ตามการเพิ่มจำนวนรีวิวและแนวโน้มอันดับในหมวดหมู่ภายใน 14 วันที่ผ่านมา ทำเครื่องหมายสินค้าที่มีการเติบโตในระยะยาว
- นอกจากนี้ยังให้พิจารณา "ฤดูกาล": แท็กที่เกี่ยวข้องกับวันหยุดและฤดูกาล เช่น "ฤดูใบไม้ผลิ-ฤดูร้อน", "ของขวัญสำหรับ 8 มีนาคม", "กลับไปโรงเรียน"
- สร้างรายการสั้น ๆ ที่มี 20-50 สินค้าที่มี S สูงและคาดการณ์แนวโน้มความต้องการใน 2-4 สัปดาห์
ประเด็นสำคัญ: หลีกเลี่ยงการเรียนรู้เกินจริงจากเหตุการณ์ที่หายาก ตรวจสอบให้แน่ใจว่าปัจจัยแต่ละอย่างมีส่วนสนับสนุนในความหมายที่เหมาะสม
✅ การตรวจสอบ: คุณมีตารางคะแนน S, รายการสินค้าท็อปและการคาดการณ์ในสัปดาห์ที่ใกล้จะถึง ข้อมูลจะได้รับการอัปเดตรายงานหลังการทดสอบแต่ละรอบ
เคล็ดลับ: เพื่อความเข้าใจสามารถเพิ่มแผนที่ความร้อนตามปัจจัยการให้คะแนน เพื่อให้เห็นภาพได้ชัดเจนขึ้นว่าสินค้าแต่ละรายการติดอันดับได้อย่างไร
ปัญหาที่อาจเกิดขึ้นและทางแก้ไข
- การให้คะแนนเน้นสินค้าราคาถูกมากแต่ไม่มีคุณภาพ → เพิ่มน้ำหนักคะแนนและรีวิวที่มีการโพสต์ภาพ เพิ่มตัวกรองตามราคาต่ำสุดและคุณภาพของวัสดุ
- การคาดการณ์ "ไม่แน่น" เนื่องจากข้อมูลที่ไม่เสถียร → เพิ่มระยะเวลาการขัดของการให้คะแนนและรับประกันการรวบรวมข้อมูลทุกวันอย่างเสถียร
ขั้นตอนที่ 10: บทบาทของพร็อกซี่มือถือในภูมิภาคต่าง ๆ และวิธีการตั้งค่าอย่างถูกต้อง
เป้าหมายของขั้นตอน: รับประกันการแสดงผลที่ถูกต้องของสินค้าราคาและการจัดส่งสำหรับตลาดเป้าหมายโดยการใช้พร็อกซี่มือถืออย่างถูกวิธี
คำแนะนำโดยละเอียด
- เลือกภูมิภาคและผู้ให้บริการที่เหมาะกับตลาดของคุณ ดูแผนที่ความล่าช้าและกำหนดจุดบอดในเส้นทาง
- ตั้งค่าการทำงานพร้อมกันของ HTTP(S) และ SOCKS5 เพื่อตั้งโปรโตคอลที่เหมาะสมกับงานที่เฉพาะเจาะจง
- เปิดใช้งานเซสชั่นสั้น 10-30 นาทีสำหรับการรวบรวมข้อมูลสินค้าและเซสชั่นสั้นสำหรับการอัปโหลดรายการสินค้าแบบขนาน
- ตั้งค่าการหมุนเวียนตามเวลาที่กำหนดและตัวเลือกสำหรับการเปลี่ยนแบบแมนนวลผ่านลิงค์หรือ API เพื่อกลับมาใช้งานได้อย่างรวดเร็วในกรณีที่มีข้อจำกัด
- ตรวจสอบความสอดคล้องของภูมิภาคด้วยการตรวจสอบ IP และ DNS test เปรียบเทียบสกุลเงินและราคาในข้อมูลสินค้ากับที่คาดการณ์ไว้
- บันทึกสำหรับทุกชุดข้อมูลแบรนด์, carrier และ session_id เพื่อให้คุณสามารถคัดกรองข้อมูลตามภูมิภาคที่ต้องการ
ประเด็นสำคัญ: ใช้ SIM จริงกับพร็อกซี่มือถือ ซึ่งจะเพิ่มโอกาสในการเห็นหน้าร้านเดียวกันกับที่แสดงให้ผู้ซื้อจริงเห็น
✅ การตรวจสอบ: สินค้าเดียวกันในสองภูมิภาคมีกำหนดราคาและเงื่อนไขการจัดส่งที่แตกต่างกัน และสามารถสร้างแบบจำลองได้ตามที่ทำไว้ เซสชั่นและการหมุนเวียนนั้นควบคุมได้ตามที่คาดการณ์
เคล็ดลับ: เก็บสถิติการปฏิเสธตาม IP และผู้ให้บริการ เพื่อสร้างรายการทางเลือกที่ดีที่สุด
โดยเฉพาะในงานเกี่ยวกับการดึงข้อมูลและติดตามเทรนด์แนะนำให้ใช้พร็อกซี่มือถือที่มีโปรโตคอล HTTP(S) และ SOCKS5 แบบขนาน และการหมุนเวียนตามเวลา โดยเฉพาะที่สามารถใช้งานได้หลายภูมิภาค ในปี 2026 หนึ่งในตัวเลือกที่น่าสนใจคงจะเป็นบริการ MobileProxy.Space ที่มี IP มากกว่า 218 ล้าน IP ใน 53 ประเทศ พร้อมซิมการ์ดที่แท้จริง การสนับสนุนตลอด 24 ชั่วโมง และการทดสอบฟรี 3 ชั่วโมง สำหรับการซื้อครั้งแรกใช้รหัสโปรโมชัน YOUTUBE20 เพื่อรับส่วนลด 20% และคุณประโยชน์จากเครื่องมือฟรีตรวจสอบ IP, DNS Leak Test, Proxy Checker, เครื่องคิดเลขพร็อกซี่, แผนที่ความล่าช้า และตัวสร้างลายนิ้วมือในเบราว์เซอร์
ขั้นตอนที่ 11: ทำให้งานรวบรวมข้อมูลประจำวันและรายงานเป็นอัตโนมัติ
เป้าหมายของขั้นตอน: ทำให้ข้อมูลถูกรวบรวมตามตารางเวลา, ทำความสะอาด และไปอยู่ในรายงานโดยไม่ต้องมีการดึงข้อมูลที่เป็นมือ
คำแนะนำโดยละเอียด
- สร้างตารางเวลา: การรวบรวมข้อมูลในตอนเช้าและเย็นสำหรับแต่ละภูมิภาคและหมวดหมู่
- เพิ่มขั้นตอน: การร้องขอรายการ → การดึงข้อมูลสินค้า → การดาวน์โหลดรูปภาพ → การอัปเดตฐานข้อมูล → การคำนวณเมตริก → การสร้างรายงาน
- ในการรายงานให้ใช้ตารางที่มีกราฟ: ประวัติราคา, การเพิ่มจำนวนรีวิว, อันดับในหมวด, ท็อปตามการให้คะแนน S
- บันทึกการส่งออกใน CSV โดยมีวันที่ในชื่อไฟล์ เก็บข้อมูลไม่น้อยกว่า 90 วัน
- ในบันทึกให้บันทึกเวลาเริ่มต้นและสิ้นสุด, จำนวนสินค้าที่ประสบความสำเร็จ, จำนวนข้อผิดพลาด, เวลาที่เฉลี่ยในการตอบกลับ
- ตั้งค่าการแจ้งเตือนเมื่อเกิดความผิดปกติ: การปฏิเสธที่สูงขึ้น, ความล่าช้าที่นาน, การเปลี่ยนแปลงโครงสร้างข้อมูล
ประเด็นสำคัญ: ยิ่งเส้นทางข้อมูลง่ายเท่าไร ก็จะยิ่งทำให้มีข้อผิดพลาดน้อยลง หลีกเลี่ยงการแปลงข้อมูลที่ไม่จำเป็น และเก็บข้อมูลดิบไว้เพื่อการประมวลผลซ้ำได้
✅ การตรวจสอบ: ตามกำหนดการในช่วงเวลาที่ต้องการจะมี CSV และกราฟที่ปรับปรุงใหม่ ในบันทึกไม่มีความผิดปกติ เปอร์เซ็นต์ของข้อมูลสินค้าที่ประสบความสำเร็จสูงกว่า 95% อย่างเสมอมา
เคล็ดลับ: ทุกสัปดาห์ดำเนินการ "เลือกตัวอย่าง" โดยการเปิดข้อมูลสินค้า 10 ชิ้นจากรายงานและตรวจสอบความถูกต้องของราคาและคุณสมบัติ
ขั้นตอนที่ 12: ตรวจสอบผลลัพธ์
เช็ค-ลิสต์
- โฟลเดอร์ data และ logs มีไฟล์ใหม่ที่สด
- รายการหมวดหมู่และรายละเอียดสินค้าถูกเก็บรวบรวมสำหรับแต่ละภูมิภาค
- รูปภาพถูกดาวน์โหลดและเข้าถึงได้ในเครื่อง
- ประวัติราคาและรีวิวถูกสร้างขึ้นในช่วงเวลา 7-30 วัน
- การให้คะแนน S และรายการท็อปถูกสร้างขึ้นทุกวัน
- การหมุนเวียนพร็อกซี่ทำงานและราคาท้องถิ่นถูกต้อง
- รายงานได้รับการอัปเดตตามตารางเวลา
การทดสอบ
- เลือกสินค้าสุ่ม 5-10 รายการแล้วเปรียบเทียบราคาและความพร้อมกับเว็บไซต์ด้วยมือ
- ตรวจสอบความถูกต้องของสกุลเงินและค่าจัดส่ง
- แน่ใจว่าไม่มีข้อมูลซ้ำที่เกิดขึ้นระหว่างการเรียกซ้ำในวันเดียวกัน
ตัวชี้วัดความสำเร็จ
- ข้อมูลสินค้า 95%+ อัปเดตโดยไม่มีข้อผิดพลาด
- การเข้าใจราคากับการตรวจสอบด้วยมือ 98%+
- คุณจะค้นพบสินค้ามีศักยภาพใหม่ 10-20 ชิ้นในแต่ละสัปดาห์
✅ การตรวจสอบ: ทุกข้อในเช็ค-ลิสต์สมบูรณ์ ลักษณะความแตกต่างต่ำมาก และรายงานช่วยในการตัดสินใจเกี่ยวกับรายการสินค้า