Bạn có bao giờ thắc mắc vì sao Google, các sàn thương mại điện tử như Lazada, Shopee, Alibaba lại có thể gợi ý sản phẩm ngay khi bạn nhập một từ khóa nào hay không? “Bí mật” đằng sau sự gợi ý này chính là Full-Text Search. Vậy, Full-Text Search là gì? Sử dụng Full-Text Search trong SQL Server như thế nào để phục vụ cho việc học tập nhé!
Nội dung chính
- 1 Tìm hiểu về Full-Text Search
- 2 Sử dụng Full-Text Search trong SQL Server
- 3 Những câu hỏi thường gặp về Full-Text Search
- 4 Full-Text Engine có vai trò như thế nào?
- 5 Tài liệu để học về Full-Text Search ở đâu?
- 6 Full-Text Search được hỗ trợ như thế nào trong các dịch vụ của Microsoft?
- 7 Vì sao phiên bản SQL Server không hỗ trợ Full-Text Search?
- 8 Vì sao Full-Text Search lại mạnh mẽ hơn LIKE?
Tìm hiểu về Full-Text Search
Full-Text Search là gì?
Full-Text Search là một giải pháp / kỹ thuật giúp bạn hoàn toàn có thể tìm kiếm thông tin một cách tự nhiên nhất. Ngôn ngữ tìm kiếm thường là ngôn từ tự nhiên ( ngôn từ thông thường của con người ), được những công cụ tìm kiếm như : Google, Bing hay những sàn thương mại điện tử lớn trong thời gian hiện tại sử dụng nhằm mục đích để tương hỗ người dùng tìm kiếm thứ họ mong ước .
Ví dụ: bạn tìm từ khóa hosting giá rẻ và Google sẽ trả lại kết quả tìm kiếm gợi ý như trong ảnh:
Full-Text Search bao gồm một hoặc nhiều cột khác nhau dựa trên những ký tự có trong bảng. Các cột dữ liệu có thể thuộc các kiểu dữ liệu như: char, varchar, nchar, nvarchar, text, ntext, image, xml hoặc varbinary (max) và cả FILESTREAM.
Vì sao nên sử dụng Full-Text Search?
Khi học và sử dụng SQL, chắc như đinh bạn đã rất quen thuộc với câu lệnh LIKE trong SQL Server, ví dụ như :
SELECT column_name(s)
FROM table_name
WHERE column_name LIKE pattern;
Trong đó, LIKE sẽ tìm kiếm thông tin số lượng giới hạn dựa trên cột được lao lý và câu lệnh LIKE thao tác “ máy móc ” theo kiểu khớp từng ký tự trong chuỗi. Vì thế, LIKE có những yếu điểm như :
- Độ chính xác thấp và khả năng tìm kết quả bằng tiếng Việt có đấu là rất tệ!
- Độ nhiễu kết quả đầu ra rất cao
- Tốc độ truy vấn rất chậm
Nếu bạn muốn có tác dụng tốt hơn, năng lực tìm kiếm bằng ngôn từ tự nhiên được cải tổ hơn và hiệu suất cũng trở nên cao hơn thì Full-Text Search sẽ là một lựa chọn tốt hơn dành cho bạn .
Và yếu tố khiến Full-Text Search trở nên tiêu biểu vượt trội hơn những kỹ thuật tìm kiếm khác đó chính là Inverted Index .
Inverted Index là gì?
Thông thường, những kỹ thuật tìm kiếm sẽ lập chỉ mục ( index ) theo đơn vị chức năng row ( document ). Đối với Inverted Index, lại khác .
Bạn hoàn toàn có thể xem Inverted Index như một dạng cấu trúc tài liệu có năng lực link giữa những term với nhau và những tài liệu chứa term đó. Sau đây sẽ là một ví dụ để bạn hoàn toàn có thể thuận tiện hiểu hơn :
ADVERTISEMENT
Chúng ta sẽ tạo ra 3 tài liệu A1, A2 và A3 như sau:
- A1 = “This is first document”
- A2 = “This is second one”
- A3 = “one two”
Sau đó, tất cả chúng ta sẽ có Inverted Index của 3 tài liệu trên được lưu lại như sau :
"this" => {A1, A2}
"is" => {A1, A2}
"first" => {A1}
"Document" => {A1}
"second" => {A2}
"one" => {A2, A3}
"two" => {A3}
Với phương pháp này, cách Full-Text Search sẽ trở nên thuận tiện hơn khi nào hết. Ví dụ :
Bạn muốn truy vấn cụm từ This is first, thông thường các phương pháp tìm kiếm khác sẽ quét từng chữ cái. Trong khi đó, bạn tìm kiếm cùng lúc trên 3 tài liệu lúc này bài toán tìm kiếm sẽ trở thành phép toán tử union của 3 tập hợp:
{A1, A2} union {A1, A2} union {A1} = {A1}
Vì vậy, khi bạn tìm kiếm dù cho các cụm từ đảo lộn thành: first This is hay This first is kết quả của phép toán union vẫn không đổi.
Sử dụng Full-Text Search trong SQL Server
Tìm hiểu về cách hoạt động của Full-Text Search trong SQL Server
Khi những cột đã được lập chỉ mục, người dùng hoàn toàn có thể sử dụng Full-Text Search theo những cách như sau :
- Một từ hoặc nhiều từ hoặc một cụm từ cụ thể (đơn giản nhất)
- Một hoặc một cụm từ bắt đầu bằng các văn bản được chỉ định (theo tiền tố)
- Một từ hoặc cụm từ gần giống với một từ hoặc một cụm từ khác (gần gũi)
- Các dạng đồng nghĩa của một cụm từ nào đó. Ví dụ trong tiếng Việt có đen, hắc, ô, mực.
Các truy vấn ( query ) sẽ không phân biệt tác dụng chữ in hoa hay in thường. Ví dụ như “ Tinohost ” và “ TinoHost ” sẽ được trả về trong hiệu quả truy vấn .
Ví dụ về Full-Text Search trong SQL Server
Thiết lập cơ bản để thực hiện Full-Text Search trong SQL Server
Để thao tác với Full-Text Search, bạn sẽ cần phải có một cơ sở tài liệu. Bạn hoàn toàn có thể tải file fullTextDatabase. sql của LaptrinhVB. net để thử nghiệm .
Bước 1: kiểm tra Full-Text Search đã được cài đặt hay chưa, bạn chạy dòng lệnh sau trong SQL Studio Management:
SELECT SERVERPROPERTY('IsFullTextInstalled')
Nếu kết quả trả về bằng 0, bạn sẽ cần cài đặt gói Full-text Search bằng cách cài đặt lại SQL Server.
Bước 2: sau khi đã cài đặt Full-Text Search xong, bạn sẽ cần cài đặt catalog cho dữ liệu mẫu như sau:
- Click chuột phải vào cơ sở dữ liệu mẫu => New Full-text Catalog.
- Cửa sổ New Full-text Catalog hiện lên, bạn bấm chọn vào Accent-insensitive và chúng ta sẽ có kết quả như sau:
Bước 3: lập chỉ mục cho Full-text:
- Click chuột phải vào bảng cần lập index trong cơ sở dữ liệu => Full-text Index => Define Full-text Index…
- Các bước cài đặt khá đơn giản bạn chỉ chỉ cần thực hiện theo hướng dẫn của cửa sổ Full-text Indexing Wizard. Bạn có thể chọn ngôn ngữ tìm kiếm là Vietnamese dù khả năng hỗ trợ từ đồng nghĩa trong tiếng Việt vẫn chưa tốt lắm.
- Kết quả cuối cùng chúng ta có khi bạn đã xong:
Câu lệnh đơn giản với Full-Text Search trong SQL Server
Ví dụ, chúng ta sẽ chạy lệnh để tìm kiếm toàn bộ những sản phẩm có từ chu (chữ, chuột, chui, chuốt, chú,…), bạn chạy thử lệnh sau để so sánh giữa LIKE và Full-Text Search nhé:
SELECT * FROM Product WHERE Name LIKE ‘%chu%’
SELECT * FROM Product WHERE CONTAINS (Name, ‘“*chu*”’)
Kết quả của chúng ta sẽ có như sau:
Bạn có thể thấy lệnh LIKE sẽ đưa ra những kết quả như: chuột, chuối, Chucha.
Trong khi đó, với Full-Text Search chúng ta có: chứng, chucha, chữa, chức, chữ,…
Như bạn thấy, hiệu quả của Full-Text Search thực sự rất đúng với nhu yếu và tương hỗ tiếng Việt có dấu tốt hơn LIKE rất nhiều !
Sau một quy trình dài tìm hiểu và khám phá về Full-Text Search là gì, Full-Text Search trong SQL Server cũng như tất cả chúng ta đã học được cách sử dụng Full-Text Search trong SQL Server cơ bản. Tng kỳ vọng, bài viết này đã giúp ích được cho bạn trong việc học tập và tìm hiểu và khám phá về Full-Text Search. Chúc bạn sẽ đạt được những hiệu quả tốt nhất trong học tập và thao tác .
Nếu nội dung bài viết có sai sót, bạn hãy liên hệ và góp ý để Tino Group hoàn toàn có thể sửa đổi nhé ! Cảm ơn bạn đã sát cánh cùng Tino Group .
Bài viết có tìm hiểu thêm từ nhiều nguồn : LaptrinhVB. net, viblo.asia, Microsoft, Red-Gate và mssqltips .
Những câu hỏi thường gặp về Full-Text Search
Full-Text Engine có vai trò như thế nào?
Full-Text Engine có 2 vai trò, trách nhiệm chính so với Full-Text Search là :
- Indexing support – hỗ trợ lập chỉ mục
- Querying support – hỗ trợ thiết lập truy vấn
Tài liệu để học về Full-Text Search ở đâu?
Nếu bạn muốn tìm hiểu và khám phá thêm về Full-Text Search trong SQL Server, bạn hoàn toàn có thể tìm hiểu thêm tài liệu từ Microsoft như : Query data trong bộ tài liệu này có rất nhiều kỹ năng và kiến thức hay và hữu dụng để học đấy !
Nếu bạn sử dụng MySQL, bạn hoàn toàn có thể tìm hiểu thêm bộ tài liệu Full-Text Search Functions nằm trong Functions and Operators của MySQL 8.0 Document .
Full-Text Search được hỗ trợ như thế nào trong các dịch vụ của Microsoft?
Tính đến thời gian tháng 9/2021, Full-Text Search đang được tương hỗ tổng lực trong toàn bộ những phiên bản SQL Server. Đối với Azure SQL Database, Azure Synapse Analytics hay Parallel Data Warehouse sẽ có 1 số ít hạn chế nhất định .
Vì sao phiên bản SQL Server không hỗ trợ Full-Text Search?
Full-Text Search là một gói thiết lập không bắt buộc trong SQL Server Database Engine. Nếu chẳng may bạn không chọn gói Full-Text Search khi setup SQL Server, bạn hoàn toàn có thể thiết lập SQL Server lại lần nữa và chọn thêm gói Full-Text Search nhé !
Vì sao Full-Text Search lại mạnh mẽ hơn LIKE?
Câu lệnh LIKE có thể giúp bạn tìm kiếm thông tin được chỉ định trong một cột và lượng thông tin tìm kiếm của LIKE là không nhiều. Tuy nhiên, nếu bạn muốn tìm kiếm mềm dẻo hơn, tốt hơn và rộng hơn, Full-Text Search chính là kỹ thuật/ câu lệnh/ giải pháp bạn đang tìm kiếm.
CÔNG TY CỔ PHẦN TẬP ĐOÀN TINO
- Trụ sở chính: L17-11, Tầng 17, Tòa nhà Vincom Center, Số 72 Lê Thánh Tôn, Phường Bến Nghé, Quận 1, Thành phố Hồ Chí Minh
Văn phòng đại diện: 42 Trần Phú, Phường 4, Quận 5, Thành phố Hồ Chí Minh - Điện thoại: 0364 333 333
Tổng đài miễn phí: 1800 6734 - Email: [email protected]
- Website: www.tino.org
5/5 – ( 1 bầu chọn )
Source: http://139.180.218.5
Category: Thuật ngữ đời thường