
Anh Tuan
Data Science Expert

Việc theo dõi giá sản phẩm là yêu cầu phổ biến trong nghiên cứu thị trường, trí tuệ thương mại điện tử, giám sát cạnh tranh và phát hiện deal. Thách thức là nhiều trang web thương mại điện tử và doanh nghiệp hiện đại sử dụng AWS WAF để bảo vệ các trang sản phẩm khỏi truy cập tự động. AWS WAF được mô tả trong tài liệu chính thức của AWS WAF là một dịch vụ tường lửa ứng dụng web giúp kiểm soát các yêu cầu HTTP và HTTPS, do đó một yêu cầu HTTP thông thường có thể thất bại trước khi automation của bạn có thể đọc được trang sản phẩm thực tế.
Mẫu workflow của CapSolver trong n8n, "Theo dõi giá sản phẩm được bảo vệ bởi AWS WAF với CapSolver, lịch trình và webhook", biến vấn đề này thành một quy trình tự động hóa có thể tái sử dụng. Mẫu này tuân theo nền tảng giải quyết AWS WAF được giải thích trong How to Solve AWS WAF in n8n with CapSolver, sau đó mở rộng mô hình này thành một quy trình giám sát thực tế, giải quyết thách thức, truy xuất trang sản phẩm được bảo vệ, trích xuất thông tin sản phẩm, so sánh giá mới nhất với dữ liệu đã lưu trước đó và gửi thông báo khi có sự thay đổi.
Mẫu được thiết kế cho một chu kỳ giám sát thực tế: kích hoạt workflow, giải quyết AWS WAF, truy xuất trang sản phẩm, trích xuất dữ liệu, so sánh với kết quả trước đó và thông báo chỉ khi phát hiện thay đổi.

AWS WAF thường hoạt động khác biệt với các hệ thống CAPTCHA truyền thống vì nó có thể dựa vào xác thực dựa trên cookie thay vì một hộp kiểm hoặc thách thức hình ảnh hiển thị. Trong nhiều trường hợp, luồng tự động hóa phải đầu tiên lấy được cookie aws-waf-token hợp lệ, sau đó gửi cookie đó trong tiêu đề Cookie khi yêu cầu trang sản phẩm được bảo vệ. Nếu bạn mới bắt đầu với mô hình tích hợp này, tích hợp CapSolver n8n CAPTCHA solver cung cấp bối cảnh hữu ích về cách CapSolver phù hợp với các workflow trong n8n.
Đối với việc theo dõi giá, chi tiết này rất quan trọng. Một workflow chỉ gửi yêu cầu GET đơn giản đến trang sản phẩm có thể nhận được trang thách thức thay vì HTML thực tế. Để trích xuất giá một cách đáng tin cậy, tự động hóa phải giải AWS WAF trước, sau đó sử dụng cookie đã giải khi yêu cầu trang đích.
| Thách thức | Tại sao quan trọng với theo dõi giá | Cách tiếp cận CapSolver + n8n |
|---|---|---|
| Thách thức AWS WAF không nhìn thấy | Trang sản phẩm có thể không được trả về cho một yêu cầu HTTP cơ bản. | Nút AWS WAF của CapSolver giải quyết thách thức trước khi truy xuất trang. |
| Truy cập dựa trên cookie | AWS WAF sử dụng cookie aws-waf-token thay vì token dạng biểu mẫu. |
Workflow gửi cookie đã giải thông qua tiêu đề HTTP Cookie. |
| Kiểm tra lặp lại | Theo dõi giá cần giám sát định kỳ, không chỉ là việc quét một lần. | Mẫu bao gồm một nút "Mỗi 6 giờ", phù hợp cho kiểm tra lặp lại mà không cần can thiệp thủ công. |
| Kiểm tra theo yêu cầu | Các nhóm có thể cần kiểm tra giá sản phẩm thông qua ứng dụng hoặc hệ thống khác. | Mẫu cũng hỗ trợ thực thi qua webhook. |
| Phát hiện thay đổi | Quét thô không đủ; người dùng cần biết điều gì đã thay đổi. | Workflow so sánh giá hiện tại và trước đó trước khi tạo thông báo. |
Mẫu CapSolver được xuất bản trong thư viện workflow n8n dưới danh mục Nghiên cứu thị trường và được tạo bởi CapSolver. Nó kết hợp lịch trình, thực thi qua webhook, giải AWS WAF, trích xuất HTML, so sánh trạng thái, và xây dựng thông báo có điều kiện vào một workflow có thể tùy chỉnh. Điều này phù hợp với khái niệm của n8n về workflow là các nút được kết nối để tự động hóa một quy trình, như được mô tả trong tài liệu chính thức n8n workflows.
Tổng quan, workflow bắt đầu hoặc theo chu kỳ định kỳ hoặc qua yêu cầu webhook. Sau đó, nó sử dụng CapSolver để giải quyết thách thức AWS WAF, gửi yêu cầu để lấy trang sản phẩm được bảo vệ, trích xuất giá sản phẩm và tên sản phẩm từ HTML, so sánh các giá trị mới với dữ liệu lưu trữ từ lần thực thi trước, và trả về hoặc ghi nhật ký kết quả tùy theo cách workflow được kích hoạt. Đối với các quy trình quét rộng hơn sử dụng tư duy tự động hóa không cần mã, bạn cũng có thể xem How to Build Scrapers for Web Scraping in n8n with CapSolver.
| Giai đoạn workflow | Mục đích | Các nút hoặc khái niệm n8n điển hình |
|---|---|---|
| Kích hoạt | Bắt đầu theo dõi tự động hoặc theo yêu cầu. | Kích hoạt lịch trình và Webhook |
| Giải AWS WAF | Lấy cookie AWS WAF cần thiết để truy cập trang đích. | Nút AWS WAF của CapSolver |
| Truy xuất trang sản phẩm | Yêu cầu trang được bảo vệ bằng cookie đã giải. | Yêu cầu HTTP |
| Trích xuất dữ liệu sản phẩm | Đọc giá và tên sản phẩm từ HTML trả về. | Trích xuất HTML với CSS selectors |
| So sánh dữ liệu | Kiểm tra xem giá mới có khác với giá trước đó đã lưu hay không. | Mã và dữ liệu tĩnh của workflow |
| Định tuyến kết quả | Quyết định xây dựng thông báo hoặc ghi nhật ký không thay đổi. | Nếu và Edit Fields / Set |
| Trả lời | Trả về kết quả cấu trúc cho các lần thực thi qua webhook. | Trả lời Webhook |
Mẫu này hữu ích vì hỗ trợ cả giám sát theo lịch trình và thực thi qua webhook. Đường đi theo lịch trình lý tưởng cho theo dõi giá liên tục. Ví dụ, ghi chú thiết lập mẫu đề cập đến việc cấu hình nút "Mỗi 6 giờ", điều này khiến nó phù hợp cho kiểm tra lặp lại mà không cần can thiệp thủ công.
Đường đi webhook hữu ích khi các công cụ nội bộ, bảng điều khiển, bot hoặc hệ thống nền cần kích hoạt kiểm tra giá theo yêu cầu. Tài liệu chính thức về nút Webhook của n8n giải thích rằng nút Webhook có thể nhận dữ liệu từ ứng dụng và dịch vụ, khởi chạy workflow và trả về đầu ra được tạo, điều này khiến nó phù hợp cho các kiểm tra giá kiểu API.
| Loại kích hoạt | Tốt nhất cho | Trường hợp sử dụng ví dụ |
|---|---|---|
| Kích hoạt theo lịch trình | Nghiên cứu thị trường liên tục và giám sát deal | Kiểm tra trang sản phẩm của đối thủ mỗi 6 giờ và thông báo khi giá thay đổi. |
| Kích hoạt qua webhook | Tự động hóa theo yêu cầu và tích hợp | Cho phép bảng điều khiển nội bộ yêu cầu giá sản phẩm được bảo vệ mới nhất khi người dùng nhấn "Làm mới". |
Trong hầu hết các workflow AWS WAF, đầu vào cần thiết là websiteURL. Khác với reCAPTCHA hoặc Turnstile, AWS WAF thường không yêu cầu websiteKey hoặc khóa trang web hiển thị. CapSolver xử lý thách thức và trả về giải pháp có thể sử dụng khi yêu cầu trang được bảo vệ. Nếu bạn cần cài đặt bước từng bước trước khi sử dụng mẫu, How to Setup CapSolver on n8n giải thích cách thêm thông tin xác thực API CapSolver trong n8n.
Chi tiết triển khai quan trọng nhất là cách giải pháp được gửi. Đối với AWS WAF, giải pháp không thường được đặt vào trường biểu mẫu. Nó được gửi dưới dạng cookie aws-waf-token thông qua tiêu đề Cookie của yêu cầu HTTP. Mẫu cốt lõi đơn giản: giải thách thức, gửi cookie đã giải cho trang đích, xác minh phản hồi, sau đó xử lý dữ liệu được bảo vệ.
| Tham số hoặc đầu ra | Vai trò trong workflow |
|---|---|
websiteURL |
URL đích nơi thách thức AWS WAF xuất hiện. |
solution.cookie |
Cookie AWS WAF đã giải được trả về bởi CapSolver. |
Tiêu đề Cookie |
Nơi gửi token AWS WAF đã giải trong yêu cầu HTTP. |
| Tham số AWS WAF tùy chọn | Các giá trị như awsKey, awsIv, awsContext hoặc awsChallengeJS có thể cải thiện độ tin cậy giải quyết cho các trang cụ thể. |
Sau khi workflow truy xuất trang thành công, nó trích xuất thông tin sản phẩm từ HTML. Trong triển khai tham khảo, bước trích xuất HTML tìm các bộ chọn giá và tiêu đề phổ biến như .product-price, [data-price], .price, h1, và .product-title. Cách tiếp cận này phù hợp với tài liệu chính thức của nút HTML n8n <a href=""https://docs.n8n.io/integrations/builtin/core-nodes/n8n-nodes-base.html/"" rel=""nofollow"">n8n HTML node documentation, giải thích rằng nút HTML có thể trích xuất nội dung từ HTML bằng cách sử dụng khóa, bộ chọn CSS, giá trị trả về và cài đặt trả về mảng.
Điều này khiến workflow dễ tùy chỉnh. Nếu trang đích của bạn sử dụng cấu trúc HTML khác, bạn có thể cập nhật các bộ chọn CSS trong nút trích xuất. Ví dụ, một trang thương mại điện tử có thể lưu trữ giá trong .sale-price, trong khi trang khác có thể sử dụng [data-testid="price"]. Hướng dẫn bộ chọn CSS của MDN <a href=""https://developer.mozilla.org/en-US/docs/Web/CSS/CSS_selectors"" rel=""nofollow"">CSS selectors guide giải thích cách các bộ chọn nhắm đến các phần tử HTML theo loại, thuộc tính, trạng thái và vị trí DOM, chính là lý do tại sao việc chọn các bộ chọn ổn định là quan trọng để trích xuất giá đáng tin cậy.
Một trình theo dõi giá chỉ hữu ích nếu nó ghi nhớ kết quả trước đó. Workflow sử dụng trạng thái workflow của n8n để so sánh giá hiện tại với giá lưu trữ trước. Trong workflow tham khảo, $workflow.staticData.lastPrice lưu trữ giá trước đó qua các lần thực thi để lần chạy tiếp theo có thể xác định xem giá có thay đổi hay không.
Điều này cho phép workflow phân biệt giữa lần kiểm tra đầu tiên, giá không thay đổi, giá giảm và giá tăng. Một sự giảm có thể được ghi nhận với mức độ "deal" cao hơn, trong khi một sự tăng có thể được ghi nhận như thông tin.
| Kết quả | Ý nghĩa | Hành động có thể |
|---|---|---|
| Lần kiểm tra đầu tiên | Chưa có giá trước đó. | Lưu giá hiện tại và trả về kết quả cơ sở. |
| Không thay đổi | Giá hiện tại và trước khớp nhau. | Ghi nhật ký "không thay đổi" và tránh thông báo không cần thiết. |
| Giá giảm | Giá hiện tại thấp hơn giá trước. | Gửi thông báo "deal" ưu tiên cao. |
| Giá tăng | Giá hiện tại cao hơn giá trước. | Gửi thông báo thông tin cho theo dõi thị trường. |
Trước khi sử dụng mẫu, bạn cần một instance n8n và tài khoản CapSolver. CapSolver có sẵn như một tích hợp trong n8n, vì vậy người dùng có thể tạo thông tin xác thực API CapSolver trong n8n và tái sử dụng nó trong các workflow khác.
Sử dụng mã
CAP26khi đăng ký tại CapSolver để nhận thêm tín dụng!
| Bước | Cấu hình cần thiết | Ghi chú |
|---|---|---|
| 1 | Thêm thông tin xác thực CapSolver trong n8n | Tạo thông tin xác thực API CapSolver và nhập khóa API của bạn. |
| 2 | Cấu hình lịch trình | Cập nhật nút "Mỗi 6 giờ" nếu bạn cần khoảng thời gian giám sát khác. |
| 3 | Thiết lập URL trang sản phẩm đích | Thay thế URL trang sản phẩm mẫu trong các nút "Truy xuất trang sản phẩm". |
| 4 | Kiểm tra các bộ chọn trích xuất | Cập nhật các bộ chọn cho giá và tên sản phẩm dựa trên HTML trang đích. |
| 5 | Cấu hình webhook | Thiết lập nút "Nhận Yêu cầu Giám sát" nếu bạn muốn kiểm tra theo yêu cầu. |
| 6 | Kiểm tra kết quả | Xác minh rằng cookie AWS WAF được chấp nhận và giá trích xuất là chính xác. |
Luồng mặc định tập trung vào giá sản phẩm và tên sản phẩm, nhưng mô hình tương tự có thể hỗ trợ nghiên cứu thị trường rộng hơn. Bạn có thể trích xuất tình trạng có sẵn, nhãn giảm giá, trạng thái tồn kho, thông tin giao hàng, tên người bán, số lượng đánh giá hoặc các biểu tượng khuyến mãi. Sau khi trích xuất, n8n có thể định tuyến kết quả đến bảng tính, cơ sở dữ liệu, kênh Slack, bot Telegram, thông báo email hoặc bảng điều khiển nội bộ. Nếu trường hợp sử dụng của bạn mở rộng sang quét trang được bảo vệ với AI, How to Scrape CAPTCHA-Protected Sites with n8n, CapSolver, and OpenClaw là một bài viết tiếp theo hữu ích.
| Tùy chỉnh | Cách áp dụng |
|---|---|
| Theo dõi nhiều trường | Thêm các bộ chọn CSS khác trong bước trích xuất HTML. |
| Giám sát nhiều sản phẩm | Nhân bản đường dẫn workflow, sử dụng danh sách URL hoặc kích hoạt workflow với payload webhook. |
| Gửi thông báo đến công cụ nhóm | Thêm nút Slack, Telegram, Discord, email hoặc cơ sở dữ liệu sau nhánh phát hiện thay đổi. |
| Lưu trữ dữ liệu lịch sử | Lưu mỗi lần kiểm tra vào Google Sheets, Airtable, Postgres, MySQL hoặc nút lưu trữ khác. |
| Sử dụng tham số AWS WAF tùy chọn | Thêm các tham số như awsContext hoặc awsChallengeJS nếu trang đích yêu cầu nhiều bối cảnh hơn. |
Để theo dõi đáng tin cậy, bắt đầu với một trang sản phẩm duy nhất và xác nhận rằng workflow có thể truy xuất HTML sản phẩm thực tế sau khi giải AWS WAF. Nếu phản hồi vẫn hiển thị trang thách thức, hãy kiểm tra xem cookie đã giải có được gửi trong tiêu đề Cookie và được sử dụng ngay sau khi giải, vì cookie thách thức có thể hết hạn nhanh.
Bạn cũng nên giữ các bộ chọn đủ cụ thể nhưng không quá dễ vỡ. Một bộ chọn như .price có thể hoạt động trên nhiều trang, nhưng một bộ chọn cụ thể hơn có thể giảm các khớp sai nếu trang chứa nhiều giá. Khi theo dõi các sản phẩm quan trọng, hãy lưu cả giá trị trích xuất thô và giá trị số đã phân tích để bạn có thể kiểm tra sự thay đổi giá sau này.
Cuối cùng, hãy xem workflow như một phần của quy trình nghiên cứu thị trường tuân thủ. Theo dõi chỉ các trang bạn được phép truy cập, tuân thủ điều khoản trang web và tránh tần suất yêu cầu quá cao. Thiết kế dựa trên lịch trình của mẫu giúp theo dõi dự đoán dễ dàng hơn thay vì liên tục tấn công một trang đích.
Lợi ích chính của mẫu CapSolver n8n là nó đóng gói một mẫu giám sát đầy đủ cho AWS WAF vào một workflow có thể tái sử dụng. Thay vì xây dựng riêng biệt các bước giải quyết, yêu cầu gửi cookie, trích xuất HTML, so sánh trạng thái, nhánh thông báo và phản hồi webhook, bạn có thể bắt đầu từ một cấu trúc hoạt động và tùy chỉnh URL đích, bộ chọn, lịch trình và điểm đến thông báo.
| Lợi ích | Tác động thực tế |
|---|---|
| Cài đặt nhanh hơn | Bắt đầu từ một workflow theo dõi giá AWS WAF đã có sẵn. |
| Ít kiểm tra thủ công hơn | Để n8n thực hiện kiểm tra giá theo lịch trình. |
| Luồng yêu cầu có nhận thức về AWS WAF | Sử dụng CapSolver để giải quyết thách thức trước khi truy xuất dữ liệu được bảo vệ. |
| Phát hiện thay đổi tích hợp | Thông báo chỉ khi dữ liệu sản phẩm thay đổi. |
| Tích hợp linh hoạt | Chạy theo lịch trình, kích hoạt bằng webhook, và kết nối kết quả đến các nút n8n khác. |
Mẫu "Theo dõi giá sản phẩm được bảo vệ bởi AWS WAF bằng CapSolver, lịch trình và webhook" (https://n8n.io/workflows/14516-monitor-aws-waf-protected-product-prices-with-capsolver-schedule-and-webhook/) là điểm bắt đầu thực tế cho việc theo dõi giá sản phẩm thương mại điện tử và nghiên cứu thị trường trên các trang được bảo vệ bởi AWS WAF. Mẫu kết hợp khả năng giải AWS WAF của CapSolver với các tính năng tự động hóa trực quan của n8n, cho phép các nhóm truy cập trang sản phẩm được bảo vệ, trích xuất dữ liệu giá, so sánh thay đổi theo thời gian và kích hoạt thông báo mà không cần viết một trình thu thập dữ liệu hoàn chỉnh từ đầu.
Nếu luồng công việc của bạn cần theo dõi các trang sản phẩm được bảo vệ, mẫu này cung cấp các thành phần cơ bản: kiểm tra theo lịch trình, thực thi webhook, giải AWS WAF, truy cập trang bằng cookie, trích xuất HTML, so sánh liên tục và thông báo có cấu trúc.
Đây là một mẫu luồng công việc của n8n được tạo bởi CapSolver để theo dõi giá sản phẩm được bảo vệ bởi AWS WAF. Mẫu giải AWS WAF, truy cập trang sản phẩm, trích xuất dữ liệu sản phẩm, so sánh các giá trị hiện tại và trước đó, và gửi thông báo khi dữ liệu thay đổi.
Có. Mẫu bao gồm trình kích hoạt theo lịch trình, và hướng dẫn cài đặt đề cập đến việc cấu hình nút "Mỗi 6 giờ". Bạn có thể điều chỉnh khoảng thời gian dựa trên nhu cầu theo dõi của mình.
Có. Mẫu cũng hỗ trợ thực thi webhook, có nghĩa là một ứng dụng, bảng điều khiển hoặc dịch vụ khác có thể kích hoạt kiểm tra giá sản phẩm và nhận kết quả.
Trong hầu hết các trường hợp, AWS WAF không yêu cầu khóa trang web công khai. Tham số websiteURL thường là tham số bắt buộc, trong khi các tham số tùy chọn có thể được sử dụng cho các triển khai cụ thể.
Token AWS WAF đã được giải nên được gửi dưới dạng cookie trong tiêu đề HTTP Cookie, không phải dưới dạng trường biểu mẫu.
Bạn nên cấu hình thông tin đăng nhập CapSolver của mình, cập nhật lịch theo dõi, thay thế URL sản phẩm mục tiêu, điều chỉnh các trình chọn CSS được sử dụng để trích xuất giá và tên sản phẩm, và cấu hình webhook nếu bạn cần kiểm tra theo yêu cầu.
Học cách các tác nhân AI trong SEO tự động hóa nghiên cứu từ khóa, phân tích đối thủ cạnh tranh và thu thập dữ liệu – và cách xử lý các thách thức CAPTCHA trong quy trình của bạn với CapSolver.

Nâng cao kỹ năng giải CAPTCHA với tài liệu API toàn diện dành cho nhà phát triển của chúng tôi. Học cách tích hợp CapSolver để xử lý reCAPTCHA, AWS WAF và nhiều hơn nữa.
