Hành trình chinh phục Schema – 1 thế giới web dễ hiểu
Từ khóa “Schema” đang trở thành chủ đề nóng hổi trong giới công nghệ. Ít ai biết rằng, hành trình chinh phục Schema là kết quả của một chặng đường dài đầy nỗ lực, từ những ngày đầu tiên của Internet.
Hãy cùng ngược dòng thời gian để hiểu hơn về lịch sử thú vị của Schema, nền tảng cho một tương lai web dễ hiểu hơn bao giờ hết.
Khát vọng về một web “có thể đọc”
Ngay từ thuở sơ khai, “cha đẻ” của World Wide Web, Sir Tim Berners-Lee, đã ấp ủ một giấc mơ về một thế giới web tràn ngập dữ liệu có thể đọc được, được kết nối một cách gọn gàng.
Giấc mơ đó đã thôi thúc ông tạo ra một mạng lưới liên kết tri thức tại CERN – Tổ chức Nghiên cứu Hạt nhân Châu Âu.
Đề xuất của ông đã nhận được sự ủng hộ nhiệt tình và Berners-Lee được CERN giao nhiệm vụ xây dựng hệ thống này.
Đó chính là tiền thân của World Wide Web, thứ mà ngày nay chúng ta không thể sống thiếu. Ông cũng chính là người tạo ra ngôn ngữ đánh dấu HTML và phần mềm để “duyệt” web.
Trong đề xuất ban đầu của mình, Berners-Lee nhấn mạnh rằng điều quan trọng không chỉ là liên kết thông tin. Điều cần thiết là phải có thông tin về ý nghĩa của các liên kết này và từ đó hình thành các kết nối. Ông cũng khẳng định rõ ràng rằng:
“Chúng ta nên hướng tới một hệ thống thông tin liên kết phổ quát, trong đó tính tổng quát và khả năng di chuyển quan trọng hơn các kỹ thuật đồ họa lạ mắt và các tiện ích bổ sung phức tạp.”
Berners-Lee có lẽ đã không ngờ rằng đề xuất của mình là khởi đầu cho một hành trình chinh phục Schema, một thứ gì đó vĩ đại, một thứ mà hầu hết chúng ta không thể tưởng tượng cuộc sống sẽ ra sao nếu thiếu nó.
Bước nhảy vọt của hành trình chinh phục schema
Nhiều năm sau, sự phát triển nhanh chóng của web đã thu hút không chỉ hàng triệu người dùng mà còn cả các công ty với những kế hoạch đầy tham vọng. Nhiều công ty trong số này bắt đầu đóng góp vào hành trình chinh phục Schema bằng các công nghệ của họ.
Internet nhanh chóng phát triển từ một nơi được xây dựng trên một vài khối xây dựng đơn giản, trở thành một mạng lưới rộng lớn và phức tạp hơn nhiều.
Không chỉ vậy, web còn trở thành một nơi không chỉ được truy cập bởi một trình duyệt đơn giản trên máy tính để bàn mà còn bởi nhiều thiết bị khác nhau — bao gồm cả trợ lý giọng nói.
Trong bối cảnh đó, các công cụ tìm kiếm ngày càng gặp khó khăn trong việc khám phá ý nghĩa từ các trang web ngày càng phức tạp.
Hơn nữa, làn sóng nội dung ập đến các công cụ tìm kiếm khiến họ buộc phải tìm cách phân loại và gắn thẻ kiến thức hiệu quả hơn. Điều này tạo động lực cho hành trình chinh phục Schema.
Giấc mơ về Web ngữ nghĩa
Năm 1999, Berners-Lee đã mơ ước về khái niệm Web ngữ nghĩa trong cuốn sách Weaving the Web:
“Tôi có một giấc mơ về Web, trong đó máy tính có khả năng phân tích tất cả dữ liệu trên Web — nội dung, liên kết và các giao dịch giữa người và máy tính.
Một “Web ngữ nghĩa”, điều làm cho điều này khả thi, vẫn chưa xuất hiện, nhưng khi nó xuất hiện, các cơ chế hàng ngày của thương mại, bộ máy quan liêu và cuộc sống hàng ngày của chúng ta sẽ được xử lý bởi các cỗ máy giao tiếp với nhau.
“Các tác nhân thông minh” mà mọi người đã tung hô về hành trình chinh phục Schema trong nhiều năm cuối cùng sẽ thành hiện thực.”
Hai năm sau, Tim Berners-Lee đã xuất bản một bài báo trên tạp chí Scientific American (thật không may, bài báo này nằm sau một bức tường phí), tinh chỉnh khái niệm về Web ngữ nghĩa, khởi động một loạt các phát triển trên mặt trận này, thúc đẩy hành trình chinh phục Schema.
Năm 2006, Berners-Lee đã bổ sung ý tưởng về Dữ liệu được liên kết:
“Web ngữ nghĩa không chỉ là đưa dữ liệu lên web. Đó là về việc tạo ra các liên kết để con người hoặc máy móc có thể khám phá web dữ liệu.
Với dữ liệu được liên kết, khi bạn có một số dữ liệu, bạn có thể tìm thấy dữ liệu khác, có liên quan đến hành trình chinh phục Schema.
Mục tiêu của Web ngữ nghĩa là làm cho web có thể đọc được bằng máy. Vì vậy, ngữ cảnh phải được thêm vào HTML để hiểu được tất cả các yếu tố khác nhau trên một trang. Nếu không có các thẻ này hỗ trợ siêu dữ liệu, máy móc sẽ khó nhận được câu trả lời đáng tin cậy từ nội dung.
Giờ đây, nhờ các tiêu chuẩn như RDF – hay Khung Phát triển Tài nguyên, chúng ta sẽ đi sâu vào hành trình chinh phục Schema trong giây lát – bạn có thể mô tả các yếu tố cho máy móc – bài viết này được viết bởi một tác giả tên là Edwin Toonen, người làm việc cho Yoast.
Vì HTML bị giới hạn trong việc mô tả tài liệu và các liên kết giữa chúng, nên cần phải có một bước bổ sung trước khi trình duyệt có thể hiểu được ngữ nghĩa.
Các Công nghệ Web Ngữ nghĩa như RDF, OWL và XML có thể mô tả nội dung của HTML – như bài viết, tên tác giả và tác phẩm được đề cập ở trên.
Người tiền nhiệm: RDF
Vào cuối những năm 90, một số khung mô tả thông tin đã xuất hiện. Các công ty đã giới thiệu một số với mục tiêu cụ thể và những công ty khác được dự định sử dụng trong một môi trường cụ thể.
Tuy nhiên, không có khung nào được phát triển như một tiêu chuẩn với ứng dụng rộng rãi – cho đến khi W3C tham gia, một cột mốc trong hành trình chinh phục Schema.
Cơ quan tiêu chuẩn web W3C – đứng đầu bởi Tim Berners-Lee, vâng, lại là ông ấy – đã đề xuất Khung Phát triển Tài nguyên, viết tắt là RDF.
Đây là một phương pháp thực tế để mô tả hoặc lập mô hình thông tin được tìm thấy trong các tài nguyên web và làm cho máy móc có thể hiểu được.
Mục tiêu của các khung như RDF là giúp xây dựng đồ thị tri thức. Đồ thị tri thức là một mạng được kết nối với các mô tả về các thực thể.
Các thực thể này là các đối tượng, sự kiện, tình huống trong thế giới thực hoặc các khái niệm trừu tượng. Cùng nhau, điều này tạo thành một hệ thống dữ liệu để máy móc diễn giải.
Để xây dựng đồ thị tri thức, các mô tả cần được thêm vào HTML và điều này có thể được thực hiện thông qua một số định dạng tuần tự hóa dữ liệu, chẳng hạn như JSON-LD và RDF/XML.
Sau đó, các loại cú pháp ký hiệu khác đã xuất hiện, như RDFa, giúp nhúng siêu dữ liệu phong phú vào tài liệu HTML.
RDF sử dụng bộ ba để giải thích một phần thông tin trong một câu lệnh: đối tượng-thuộc tính-chủ thể.
Điều này làm cho nó cực kỳ mạnh mẽ, nhưng cũng không cần thiết phải phức tạp đối với nhiều mục đích chung.
Wikipedia giải thích rất rõ: “Chủ thể biểu thị tài nguyên và vị ngữ biểu thị các đặc điểm hoặc khía cạnh của tài nguyên và thể hiện mối quan hệ giữa chủ thể và đối tượng.
Ví dụ, một cách để thể hiện khái niệm “Bầu trời có màu xanh” trong RDF là bộ ba: một chủ thể biểu thị “bầu trời”, một vị ngữ biểu thị “có màu” và một đối tượng biểu thị “xanh”.
Do đó, RDF sử dụng chủ thể thay vì đối tượng (hoặc thực thể) trái ngược với cách tiếp cận điển hình của mô hình thực thể-thuộc tính-giá trị trong thiết kế hướng đối tượng: thực thể (bầu trời), thuộc tính (màu) và giá trị (xanh lam) .”
RDF đã bị hiểu lầm một chút vào thời điểm đó và một phần là nhờ danh sách các phần phụ ngày càng mở rộng, đã không trở thành tiêu chuẩn thực tế mà nó được cho là sẽ trở thành.
Các cú pháp khác
Vào đầu những năm 2000, một cú pháp khác để mô tả siêu dữ liệu đã xuất hiện: Microformats. Điều này được giới thiệu bởi nhóm làm việc HTML WHATWG và đề xuất một cái nhìn đơn giản hơn nhiều về Web Ngữ nghĩa.
Nó dựa trên một số tiêu chuẩn hiện có nhưng sử dụng một định dạng dễ hiểu hơn. Mục tiêu là “viết nội dung một lần” và thêm ngữ cảnh vào nội dung mà con người có thể đọc được.
Thật không may, cú pháp Microformats không có tham vọng và thiếu khả năng mở rộng. Thêm vào đó, bằng cách gắn kết nội dung mà con người có thể đọc được với mã mà máy móc có thể đọc được, mọi thứ trở nên mong manh.
Việc duy trì cả hai và sửa chữa mọi thứ bất cứ khi nào có gì đó thay đổi trở nên khó khăn hơn. Trong ví dụ bên dưới, bạn có thể thấy mã phức tạp như thế nào với Microformats trong hành trình chinh phục Schema.
<div class=”vcard”>
<a class=”url fn” href=”http://tantek.com/”>Tantek Çelik</a>
<div class=”org”>Technorati</div>
<div class=”tel”>+1-415-555-1212</div>
</div>
Use code with caution.
Html
Khi Google giới thiệu đoạn trích phong phú – kết quả tìm kiếm được đánh dấu cho những thứ như sự kiện, thời gian chiếu phim, sự kiện, v.v. – vào tháng 5 năm 2009, hai cú pháp được sử dụng để nhận các đoạn trích phong phú này là Microformats và RDFa. Bắt đầu từ năm 2015 trở đi, Google bắt đầu ưu tiên cú pháp thứ ba: JSON-LD.
JSON-LD, hay Ký hiệu Đối tượng JavaScript cho Dữ liệu được liên kết, là một phương pháp mô tả dữ liệu được liên kết bằng JSON. JSON-LD là một đoạn mã giúp mô tả nội dung của bạn cho các công cụ tìm kiếm. Bạn có thể mô tả giá nào thuộc về sản phẩm nào hoặc mã zip nào thuộc về công ty nào.
Về cơ bản, thay vì thêm các thuộc tính ngữ nghĩa vào các phần tử riêng lẻ trên trang, bạn đang cung cấp một khối mã JavaScript nhỏ chứa tất cả thông tin đó – bao gồm tất cả các kết nối trong hành trình chinh phục Schema.
Điều này được chứng minh là một phần thiết yếu của hành trình chinh phục Schema.
Ví dụ bạn đã thấy ở trên, bây giờ trong JSON-LD:
<script type=”application/ld+json”>
{
“@context”: “http://schema.org”,
“@type”: “Person”,
“name”: “Tantek Çelik”,
“url”: “http://tantek.com/”,
“worksFor”: {
“@type”: “Organization”,
“name”: “Technorati”
},
“telephone”: “+1-415-555-1212”
}
</script>
Use code with caution.
Json
Hành trình chinh phục Schema dễ hiểu cho cả con người và máy móc!
2011: Giới thiệu Schema.org – bước ngoặt trong hành trình chinh phục Schema
Một trong những lý do tại sao các định dạng dữ liệu có cấu trúc trước đó không có chỗ đứng là do thiếu một từ vựng chung được chia sẻ trên các công cụ tìm kiếm trong hành trình chinh phục Schema.
Điều này khiến việc thêm một cái gì đó vào trang web của bạn mà bất kỳ công cụ tìm kiếm nào cũng có thể hiểu được, điều này khiến các công cụ tìm kiếm khó quảng bá việc thêm nó.
Ngoài ra, các giải pháp khả dụng đã thất bại trong việc thực sự đạt được mục tiêu dữ liệu được liên kết đó. Đó là lý do tại sao vào ngày 2 tháng 6 năm 2011, Google, Bing và Yahoo! đồng loạt công bố Schema.org. Yandex tham gia sáng kiến này vào tháng 11 năm 2011.
Nhờ Schema, hiện nay có một từ vựng chung giữa các công cụ tìm kiếm – có thể đọc được không chỉ đối với trình thu thập thông tin mà còn cho các ứng dụng và định dạng dữ liệu khác trong hành trình chinh phục Schema.
Tất nhiên, các công cụ tìm kiếm có thể đọc nội dung hơi khác một chút hoặc họ có thể hỗ trợ ít phần hơn, nhưng dù sao nó cũng vô cùng có giá trị trong hành trình chinh phục Schema.
Với việc giới thiệu Schema, một số lượng lớn các loại mới đã ra đời, từ phim ảnh đến sản phẩm, cộng với khả năng mở rộng, nếu bất kỳ ai muốn làm như vậy.
Sự phát triển của Schema diễn ra công khai, đúng như nó phải như vậy. Trong mỗi bản phát hành, các loại mới đang được thêm vào, cải thiện hoặc mở rộng, thường dựa trên đầu vào cho các bên bên ngoài.
Vào tháng 9 năm 2011, một bộ thuộc tính liên quan đến tin tức mới đã xuất hiện. Tháng 11 năm 2012, Schema.org đã bắt tay với dự án GoodRelations để mang một loạt các loại liên quan đến thương mại điện tử vào từ vựng. Sau đó, nó dần dần được mở rộng với ngày càng nhiều thuộc tính.
Năm 2013, Schema đã thêm các hành động vào dự án. Điều này làm cho nó có thể không chỉ mô tả một cái gì đó mà còn thêm một phản hồi vào đó trong hành trình chinh phục Schema.
Vì vậy, bạn không chỉ điền vào giờ mở cửa của nhà hàng mà còn biến việc đặt chỗ thành một hành động. Nó chỉ là một trong nhiều ứng dụng mới của từ vựng được chia sẻ này.
Schema ngày nay: bước tiến mới trong hành trình chinh phục Schema
Qua nhiều năm, việc áp dụng Schema ngày càng phát triển nhanh hơn. Các công cụ tìm kiếm đã áp dụng nhiều loại hơn nữa và biến những hiểu biết sâu sắc của họ về nội dung thành kết quả phong phú hơn bao giờ hết. Dữ liệu có cấu trúc lược đồ hỗ trợ nhiều kết quả phong phú mới nhất và không có dấu hiệu kết thúc.
Ngoài ra, vai trò của nó đang được mở rộng. Ngày nay, chúng ta cũng thấy Schema tích cực giúp các công cụ tìm kiếm hiểu được các sự kiện lịch sử như COVID-19 bằng cách cung cấp các loại cụ thể để mô tả các sự kiện này trong hành trình chinh phục Schema.
Schema hiện là một phần quan trọng của SEO, vì kết quả phong phú có thể giúp bạn ‘bỏ qua’ nấc thang xếp hạng thông thường.
Tuy nhiên, ngày nay, chủ yếu chỉ có Google quản lý và đóng góp cho Schema, vì Yahoo/Yandex, v.v. không phải là một phần của bối cảnh.
Google tập trung chiến lược vào việc mở rộng hỗ trợ và các tính năng cho đánh dấu Schema, vì nó giúp họ hiểu rõ hơn về web – từ đó giúp họ cung cấp dịch vụ tốt hơn, kết quả bằng giọng nói, quảng cáo, v.v.
Khám phá bộ sưu tập tìm kiếm của Google để hiểu được kết quả phong phú nào được cung cấp bởi dữ liệu có cấu trúc
Sau khi Google áp dụng JSON-LD làm cú pháp ký hiệu ưa thích, việc triển khai dữ liệu có cấu trúc cũng trở nên dễ dàng hơn.
Trong cú pháp ký hiệu cổ điển, siêu dữ liệu phải được nhúng vào HTML, khiến việc thêm vào trở nên khó khăn.
Mã trở nên cồng kềnh và dễ bị lỗi. JSON-LD đã làm cho việc lấy mô tả ra khỏi nội dung trở nên khả thi, có thể nói là làm cho việc liên kết đúng tất cả các yếu tố khác nhau với nhau trở nên khả thi – trên con đường của chúng ta đến một web dữ liệu được liên kết.
Lịch sử của Schema: hành trình chinh phục Schema là một chặng đường dài
Hành trình chinh phục Schema là một nhiệm vụ tìm kiếm một web có thể đọc được bằng máy – một web ngữ nghĩa.
Bằng cách mô tả nội dung của bạn bằng Schema, bạn đang tích cực giúp máy móc hiểu được web – giúp bạn có được kết quả tốt hơn.
Trong khi dữ liệu có cấu trúc đã đi một chặng đường dài, những năm tháng tốt đẹp nhất của nó vẫn còn ở phía trước. Sẽ còn rất nhiều điều nữa sắp tới!
Bạn muốn tìm hiểu thêm? Chúng tôi đã ra mắt khóa đào tạo Hiểu dữ liệu có cấu trúc! Trong khóa học này, chúng tôi giải thích chi tiết dữ liệu có cấu trúc là gì và cách bạn có thể cải thiện cơ hội nhận được kết quả phong phú của riêng mình.
Truy cập khóa học Hiểu dữ liệu có cấu trúc này bằng cách truy cập Premium! Điều này cũng cung cấp cho bạn quyền truy cập vào tất cả các khóa học SEO khác của chúng tôi và các tính năng bổ sung trong Yoast SEO.
Bản tóm tắt nhanh của Rich:
Có vẻ như Schema sẽ ở lại đây. Và sẽ ngày càng trở nên quan trọng hơn. Vì vậy, nếu SEO là một phần trong chiến lược tiếp thị của bạn, chúng tôi phải giúp bạn đạt được một số kết quả phong phú cho riêng mình!
Để tăng cơ hội nhận được các đoạn trích phong phú sẽ giúp bạn nổi bật, hãy đảm bảo thêm dữ liệu có cấu trúc vào nội dung của bạn. Nếu bạn chưa làm điều này, Yoast SEO có thể giúp bạn!
Hành trình chinh phục Schema vẫn đang tiếp diễn với tốc độ chóng mặt và mang lại nhiều lợi ích cho người dùng và các công ty.
Việc hiểu rõ lịch sử và những bước tiến mới nhất của Schema sẽ giúp bạn tận dụng tối đa tiềm năng của nó cho trang web của mình.
Xem Thêm: Vũ khí tối thượng giúp website của bạn toả sáng trên Google – Bật mí bí ẩn về Schema.org và JSON-LD: