Cách cấu hình YaCy làm Công cụ Tìm kiếm Thay thế hoặc Công cụ Tìm kiếm Trang web
Nhiều người có mối quan tâm chính đáng về thông tin cá nhân và quyền riêng tư của họ thuộc quyền tự do của các công ty lớn. Mặc dù có nhiều dự án khác nhau với mục tiêu là cho phép user giành lại quyền sở hữu dữ liệu của họ, nhưng vẫn có một số lĩnh vực máy tính thông thường khiến user khó thoát khỏi các sản phẩm do doanh nghiệp kiểm soát.Công cụ tìm kiếm là một trong những lĩnh vực mà nhiều người có ý thức về quyền riêng tư phàn nàn. YaCy là một dự án nhằm khắc phục sự cố của các nhà cung cấp công cụ tìm kiếm sử dụng dữ liệu cho những mục đích bạn không có ý định. YaCy là một công cụ tìm kiếm ngang hàng, nghĩa là không có cơ quan hoặc server tập trung nào lưu trữ thông tin của bạn. Nó hoạt động bằng cách kết nối với một mạng lưới những người cũng chạy các version YaCy và thu thập dữ liệu web để tạo một index phân tán của các trang web.
Trong hướng dẫn này, ta sẽ thảo luận về cách bắt đầu với YaCy trên version VPS Ubuntu 12.04. Sau đó, bạn có thể sử dụng điều này để đóng góp vào mạng lưới global của các đồng nghiệp tìm kiếm hoặc để tạo index tìm kiếm cho các trang và dự án của bạn .
Download các thành phần
YaCy có rất ít phụ thuộc bên ngoài gói. Khá nhiều thứ duy nhất cần có trên một bản phân phối Linux hiện đại phải là bộ công cụ phát triển Java mở version 6.
Ta có thể lấy điều này từ repository mặc định của Ubuntu bằng lệnh :
sudo apt-get update sudo apt-get install openjdk-6-jdk
Quá trình này sẽ mất một lúc để download tất cả các thành phần cần thiết.
Sau khi hoàn tất, bạn có thể tải version YaCy mới nhất từ trang web của dự án . Ở phía bên phải, nhấp chuột phải hoặc điều khiển nhấp vào liên kết cho GNU / Linux và chọn vị trí liên kết sao chép:
Quay lại VPS của bạn, thay đổi thành folder chính của user của bạn và download chương trình bằng wget:
cd ~ wget http://yacy.net/release/yacy_v1.68_20140209_9000.tar.gz
Sau khi quá trình download hoàn tất, bạn có thể extract các file vào folder riêng của nó:
tar xzvf yacy*
Bây giờ ta có tất cả các thành phần cần thiết để chạy công cụ tìm kiếm của riêng ta .
Khởi động Công cụ Tìm kiếm YaCy
Ta gần như đã sẵn sàng để bắt đầu sử dụng công cụ tìm kiếm YaCy. Trước khi bắt đầu, ta cần điều chỉnh một tham số.
Thay đổi vào folder YaCy. Từ đây, ta có thể áp dụng các thay đổi cần thiết và sau đó bắt đầu dịch vụ:
cd ~/yacy
Ta cần thêm tổ hợp tên user và password administrator vào file để ta có thể khám phá toàn bộ giao diện. Với editor của bạn, hãy mở file khởi tạo mặc định YaCy:
nano defaults/yacy.init
Đây là một file cấu hình rất dài được comment tốt. Tham số mà ta đang tìm kiếm được gọi là adminAccount
.
Tìm kiếm thông số adminAccount
. Bạn sẽ thấy rằng nó hiện chưa được đặt:
adminAccount= adminAccountBase64MD5= adminAccountUserName=admin
Bạn cần đặt account quản trị và password theo định dạng sau:
<pre>
adminAccount = admin: <span class = “highlight”> your_password </span>
adminAccountBase64MD5 =
adminAccountUserName = admin
</pre>
Điều này sẽ cho phép bạn đăng nhập vào các phần quản trị của giao diện web khi bạn khởi động dịch vụ.
Lưu và đóng file .
Khi đã sẵn sàng , hãy bắt đầu dịch vụ bằng lệnh :
./startYACY.sh
Điều này sẽ khởi động công cụ tìm kiếm YaCy.
Truy cập giao diện web YaCy
Như vậy, ta có thể truy cập công cụ tìm kiếm của bạn bằng cách chuyển đến trang này bằng trình duyệt web :
<pre>
http: // <span class = “highlight”> server_ip </span>: 8090
</pre>
Bạn sẽ thấy trang tìm kiếm YaCy chính:
Như bạn thấy , đây là một trang công cụ tìm kiếm khá thông thường. Bạn có thể tìm kiếm bằng thanh tìm kiếm được cung cấp mà không cần bất kỳ cấu hình bổ sung nào, nếu bạn muốn.
Mặc dù vậy, ta sẽ khám phá giao diện quản trị vì điều đó cung cấp cho ta sự linh hoạt hơn rất nhiều. Nhấp vào liên kết "Quản trị" ở góc trên bên trái của trang:
Bạn sẽ được đưa đến trang cấu hình cơ bản:
Điều này sẽ xem xét một số tùy chọn phổ biến mà bạn có thể cần cài đặt ngay lập tức.
Đầu tiên, nó hỏi về các tùy chọn ngôn ngữ. Thay đổi điều này nếu một trong các ngôn ngữ khác được liệt kê phù hợp hơn với mục đích sử dụng của bạn.
Câu hỏi thứ hai quyết định cách bạn muốn sử dụng version YaCy này. Cấu hình mặc định là sử dụng máy tính của bạn để tham gia mạng tìm kiếm global thu thập thông tin và lập index web. Đây là cách tìm kiếm dựa trên ngang hàng hoạt động để thay thế các công cụ tìm kiếm truyền thống.
Điều này sẽ giúp bạn tham gia cùng các đồng nghiệp trong việc cung cấp một nguồn tìm kiếm tuyệt vời và sẽ cho phép bạn tận dụng công việc mà những người khác đã bắt đầu.
Nếu bạn không muốn sử dụng YaCy như một công cụ tìm kiếm truyền thống, thay vào đó bạn có thể chọn tạo cổng tìm kiếm cho một trang web bằng cách chọn tùy chọn thứ hai hoặc sử dụng nó để lập index mạng local bằng cách chọn tùy chọn thứ ba.
Hiện tại, ta sẽ chọn tùy chọn đầu tiên.
Cài đặt thứ ba là tạo một tên ngang hàng duy nhất cho máy tính này. Nếu bạn có nhiều server đang chạy YaCy, điều này ngày càng trở nên quan trọng nếu bạn muốn ngang hàng với chúng độc quyền. Dù bằng cách nào, hãy chọn một tên duy nhất ở đây.
Đối với phần thứ tư, bỏ chọn “ Cấu hình bộ định tuyến của bạn cho YaCy” vì công cụ tìm kiếm của ta được cài đặt trên một VPS không chạy sau bộ định tuyến truyền thống.
Nhấp vào “Đặt cấu hình” khi bạn hoàn tất.
Thu thập thông tin các trang web để đóng góp vào chỉ số global
Đến đây bạn có thể tìm kiếm bằng cách sử dụng các index được lưu giữ trên các đồng nghiệp YaCy của bạn. Kết quả tìm kiếm sẽ ngày càng chính xác khi có nhiều người tham gia vào hệ thống.
Ta có thể đóng góp bằng cách thu thập dữ liệu các trang web trên version YaCy của ta để các đồng nghiệp khác có thể tìm thấy các trang ta đã thu thập thông tin.
Để bắt đầu quá trình này, hãy nhấp vào liên kết “Máy thu thập thông tin / Máy thu hoạch” ở phía bên trái trong phần “Sản xuất index ”.
Nếu bạn đã cố gắng tìm kiếm thứ gì đó và không nhận được kết quả như mong đợi, hãy xem xét bắt đầu lập index các trang trên trang web với version của bạn. Nó sẽ làm cho tìm kiếm của bạn chính xác hơn cho chính bạn và đồng nghiệp của bạn.
Nhập URL mà bạn muốn lập index trong phần "URL bắt đầu":
Điều này sẽ điền danh sách các liên kết mà YaCy tìm thấy trên URL được đề cập.Bạn có thể chọn URL ban đầu mà bạn đã nhập hoặc chọn sử dụng danh sách liên kết từ trang bạn đã nhập.
Hơn nữa, bạn có thể chọn xem bạn muốn lập index bất kỳ liên kết nào trong domain hay bạn chỉ muốn lập index những liên kết là đường dẫn phụ của URL đã cho.
Sự khác biệt là nếu bạn nhập vào http://example.com/about
, tùy chọn đầu tiên sẽ lập index http://example.com/sites
, trong khi tùy chọn thứ hai sẽ chỉ lập index các trang nằm bên dưới đường dẫn đã nhập ( http://example.com/about/me
).
Bạn có thể giới hạn số lượng tài liệu mà thu thập thông tin của bạn sẽ lập index . Nhấp vào “Bắt đầu thu thập thông tin mới” khi bạn hoàn tất để bắt đầu thu thập thông tin trang web đã chọn.
Nhấp vào liên kết "Giám sát sáng tạo" ở phía bên trái để xem tiến trình lập index . Bạn sẽ thấy thông tin như thế này:
Server của bạn sẽ thu thập dữ liệu URL được chỉ định với tốc độ 2 yêu cầu mỗi giây cho đến khi hết các liên kết được liên kết với nhau hoặc đạt đến giới hạn bạn đã đặt.
Sau đó, nếu bạn tìm kiếm một trang liên quan đến việc thu thập thông tin của bạn , thì kết quả bạn đã lập index sẽ đóng góp vào kết quả.
Sử dụng YaCy cho trang web
Một điều mà YaCy được dùng là cung cấp chức năng tìm kiếm cho trang web . Bạn có thể cấu hình index trang web của bạn để hoạt động như một công cụ tìm kiếm được giới hạn cho domain của bạn.
Đầu tiên, hãy chọn “ Control panel dành cho administrator ” trong phần “Kiểm soát ngang hàng” ở phía bên trái. Trong console dành cho administrator , quay lại trang “Cấu hình cơ bản”.
Lần này, đối với câu hỏi thứ hai, hãy chọn “Cổng tìm kiếm cho các trang web của bạn ”:
Nhấp vào “Đặt cấu hình” ở dưới cùng.
Tiếp theo, bạn cần thu thập thông tin domain của bạn để tạo nội dung sẽ có sẵn thông qua công cụ tìm kiếm của bạn. , hãy nhấp vào liên kết “Máy thu thập thông tin / Máy thu hoạch” trong phần “Sản xuất index ” ở phía bên trái.
Nhập URL của bạn vào trường "URL bắt đầu". Nhấp vào “Bắt đầu thu thập thông tin mới” khi bạn đã chọn các tùy chọn của bạn :
Tiếp theo, nhấp vào liên kết “Tích hợp tìm kiếm vào các trang web bên ngoài” trong phần “Thiết kế tìm kiếm” ở phía bên trái.
Có hai cách riêng biệt để cấu hình tìm kiếm YaCy. Ta sẽ sử dụng cái thứ hai, được gọi là “Truy cập từ xa thông qua YaCy Peer đã chọn”.
Bạn sẽ thấy rằng YaCy tự động tạo mã mà bạn cần để nhúng vào một trang web trên trang web của bạn :
Trên trang web , bạn cần tạo một trang có mã này bên trong. Bạn có thể phải điều chỉnh địa chỉ IP và cổng để phù hợp với cấu hình của server có cài đặt YaCy.
Đối với trang web của tôi, tôi đã tạo trang search.html
trong folder root của server của tôi. Tôi đã tạo một trang html đơn giản và bao gồm mã do YaCy tạo:
<pre>
<html>
<head>
<title> Kiểm tra </title>
</head>
<body>
<h1> Trang tìm kiếm </h1>
<p> Ta bắt đầu… </p>
<span class = “highlight”> <script src = “ http://111.111.111.111:8090/jquery/js/jquery-1.7.min.js ” type = “text / javascript” type = “text / javascript”> </script> </span>
<span class = “highlight”> <script> </span>
<span class = “highlight”> $ (document) .ready (function () {</span>
<span class = “highlight”> yconf = {</span>
<span class = “highlight”> url: ' http://111.111.111.111:8090 ', </span>
<span class = “highlight”> title: 'Tiện ích tìm kiếm YaCy', </span>
<span class = “highlight”> logo: '/yacy/ui/img/yacy-logo.png', </span>
<span class = “highlight”> link: ' http://www.yacy.net ', </span>
<span class = “highlight”> global: false, </span>
<span class = “highlight”> width: 500, </span>
<span class = “highlight”> height: 600, </span>
<span class = “highlight”> vị trí: ['top', 30], </span>
<span class = “highlight”> theme: 'start' </span>
<span class = “highlight”>}; </span>
<span class = “highlight”> $ .getScript (yconf.url + '/ portalsearch / yacy-portalsearch.js', function () {}); </span>
<span class = “highlight”>}); </span>
<span class = “highlight”> </script> </span>
<span class = “highlight”> <div id = “yacylivesearch”> </span>
<span class = “highlight”> <form id = “ysearch” method = “get” accept-charset = “UTF-8” action = “ http://111.111.111.111:8090/yacysearch.html ”> </ span >
<span class = “highlight”> Tìm kiếm trực tiếp <input name = “query” id = “yquery” class = “ưa thích” type = “text” size = “15” maxlength = “80” value = “” /> </ span>
<span class = “highlight”> <input type = “hidden” name = “verify” value = “cacheonly” /> </span>
<span class = “highlight”> <input type = “hidden” name = “MaximumRecords” value = “20” /> </span>
<span class = “highlight”> <input type = “hidden” name = “resource” value = “local” /> </span>
<span class = “highlight”> <input type = “hidden” name = “urlmaskfilter” value = “. *” /> </span>
<span class = “highlight”> <input type = “hidden” name = “prefermaskfilter” value = “” /> </span>
<span class = “highlight”> <input type = “hidden” name = “display” value = “2” /> </span>
<span class = “highlight”> <input type = “hidden” name = “nav” value = “all” /> </span>
<span class = “highlight”> <input type = “submit” name = “Enter” value = “Search” /> </span>
<span class = “highlight”> </form> </span>
<span class = “highlight”> </div> </span>
</body>
</html>
</pre>
Sau đó, bạn có thể lưu file và truy cập file từ trình duyệt web của bạn bằng cách đi tới:
<pre>
http: // <span class = “highlight”> domain web của bạn </span> /search.html
</pre>
Trang của tôi trông như thế này:
Khi bạn nhập điều khoản, bạn sẽ thấy các trang trong domain của bạn có liên quan đến truy vấn:
Kết luận
Bạn có thể sử dụng YaCy theo nhiều cách.Nếu bạn muốn đóng góp vào index global để tạo ra một giải pháp thay thế khả thi cho các công cụ tìm kiếm do các công ty duy trì, bạn có thể dễ dàng thu thập dữ liệu các trang web và cho phép server của bạn là một server ngang hàng cho những user khác.
Nếu bạn cần một công cụ tìm kiếm tuyệt vời cho trang web của bạn , YaCy cũng cung cấp tùy chọn đó. YaCy rất linh hoạt và là một giải pháp thú vị cho vấn đề liên quan đến quyền riêng tư.
<div class = “author”> Bởi Justin Ellingwood </div>
Các tin liên quan