Lại là crawler

 

Tình hình là sau chục ngày không động vào cái blog này thì mình thấy nó sắp mốc đến nơi rồi đây. Chính vì vậy để nó không chuyển hóa thành mẻ nên nay mình sẽ cố gắng rặn ra 1 bài viết mới mặc dù trong đầu dạo này bí ý tưởng quá, chả nghĩ viết được gì cả chưa kể mình đã bắt đầu sang chỗ làm mới nên vẫn còn đang say sưa làm việc chưa có nhiều thời gian rảnh như giai đoạn trước :)) Do đó khả năng blog sẽ bị bỏ bê 1 thời gian dài nữa là rất có thể :3 Mong anh em thông cảm.

never-ending-time-134043459-575079093df78c9b46d879fc

Do không biết viết về chủ đề nào mới mẻ cả nên mình lại quay ra 1 chủ đề mà được nhắc khá nhiều trong blog của mình đó là vấn đề crawler ứng dụng ấy mà :3 Anh em nào chưa biết thì có thể thị dâm ở các link sau

Xây dựng ứng dụng crawler với .NET

Tớ đã học python như thế nào

Xây dựng chatbot cùng API.AI: tổng quan về Flask và Heroku (phần 3)

Anh em đều thấy là nếu làm thế thì phải biết code, mệt bỏ bu ra được. Ngồi phân tích nào là cú pháp nọ cú pháp chai, viết code đọc mã HTML rồi parse loằng ngoằng gì đó nữa. Thấy vất vả quá mà kết quả thu được thì cũng thường thôi, do vậy nay mình xin giới thiệu 1 tool dành cho tất cả mọi người, ai ai cũng có thể sử dụng được. Đơn giản, tiện lợi, chỉ cần click là xong :3 Đấy nghe yêu chưa, thích chưa. :* Nói vậy không phải là nó không có nhược điểm gì cả 😦 Nhược điểm duy nhất của em nó chính là dùng miễn phí thì được 100 dòng dữ liệu crawl thôi; muốn hơn hả thì xì tiền ra nhé :)). Tên của nó là DataToolbar

Screen Shot 2017-05-08 at 6.20.02 AM

Cách dùng của nó thì đơn giản quá nên mình chả muốn mô tả chi tiết gì cả :(( Dạo này đang lười nên thật sự ngại quá :3 Tuy vậy anh em có thể xem cờ nhíp trên Iu sờ tu be để biết cách sử dụng, không có gì khó đâu, nhìn hình là có thể làm theo được ngay nhé :v

Đại loại thì trong cờ nhíp sẽ hướng dẫn cách anh em crawl data từ 1 trang web lấy thông tin kiểu danh sách khách sạn từ tên khách sạn, địa chỉ, rổ giá, hình ảnh khách sạn rồi lưu ra 1 file Excel. Công việc của anh em đơn giản là chỉ ra cho nó chỗ nào là mình cần lấy này, chỗ nào là nút Next sang trang, phần chi tiết thì nó sẽ ấn vào đâu…Tất cả thì chỉ cần xem cờ nhíp thôi :3 Nếu mà cờ nhíp nhanh chóng mặt làm anh em ta như trong Fast Of Furious 8 thì anh em có thể xem bình tình từ từ bằng 1 bài viết dài thật dài hướng dẫn từ A đến X (vì đến Z thì e hèm…) trong trang chủ theo đường link http://datatoolbar.com/tutorial.html

anh-1-1492747000277

Trong bài viết đó thì gần như sẽ đầy đủ và chi tiết nhất cách sử dụng datatoolbar từ việc sử dụng các sự kiện tương tác với web, cách dùng XPATH để lấy thông tin, cách hẹn giờ để ứng dụng tự chạy rồi tổng hợp lại. Nói chung thì rất rất là chi tiết nên mình sẽ để đó và không nói gì thêm. Bất tiện cái là nó viết bằng tiếng Anh, thôi các đồng dâm cố gắng lên; không dùng Google Translate để dịch ra mà hiểu vậy

Chốt lại bài viết này thì đơn giản chỉ là đề giới thiệu cái tool đó thôi chứ không có gì cao siêu cả. Ứng dụng này sẽ giúp anh em nhanh cmn chóng thu thập được thông tin từ các website rất hợp với các bạn nữ văn phòng xinh xắn đáng yêu bị những thằng sếp già nua xấu xí như trong 1 số bộ phim Nhật bổn hay chiếu, giao cho những công việc vất vả mang đầy tính chất tay chân là thống kê cho anh số liệu hay tìm cho anh các văn bản hầm bà lằng nhắng gì đó mà có trời mới biết :v. Thôi các em gái cố gắng lên còn anh đi ăn sáng đây :v

f543f59681ee4b2404518c9a8c1f3adb

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s