Nội dung trùng lặp là gì? Duplicate Content - adtechjsc


Hướng dẫn chi tiết về nội dung trùng lặp, các nguyên nhân gây ra và cách khắc phục triệt để các lỗi do nội dung trùng lặp gây ra - adtechjsc



Hiểu đúng về nội dung trùng lặp trên website?

Nội dung trùng lặp (tên tiếng anh là Duplicate Content) là nội dung xuất hiện trên Internet tại hơn một địa chỉ ( URL) hay nói theo một cách khác Duplicata Content là sự xuất hiện của 1 nội dung trên nhiều website khác nhau.

Nội dung trùng lặp là gì? Duplicate Content - adtechjsc
Nội dung trùng lặp sẽ không tốt đối với các website và sẽ khó phát triển


Chúng ta sẽ phải hiểu nôm na rằng khi chúng ta tìm một vật gì đó mà có tới 2 cái liên quan, sự phân vân và so sánh để lựa chọn 1 trong 2 (hay nhiều) sản phẩm này sẽ được đưa ra. Vậy đâu là tiêu chí lựa chọn sản phẩm nội dung phù hợp? Chúng ta buộc phải tư duy đến việc chọn lựa đâu là sản phẩm tốt được chọn lựa (nhiều người xem, cách thức trình bày nội dung, phù hợp thẻ tiêu đề, thẻ miêu tả hợp lý... )

Để đưa ra kết quả tìm kiếm tốt nhất, công cụ tìm kiếm sẽ hạn chế hiển thị các nội dung bị sao chép, vì thế bắt buộc phải lựa chọn phiên bản nhiều khả năng là bản gốc nhất (hoặc tốt nhất).

Ba vấn đề lớn nhất mà một nội dung trùng lặp có thể gây ra:

  1. Search engine (SE) không thể phân biệt phiên bản nào được copy, phiên bản nào là gốc.
  2. SE không biết nên hướng các link metrics (mozrank, moztrust, bản quyền, anchor text, link juice …) đến một trang web, hay giữ tách rời giữa nhiều phiên bản.
  3. SE không biết nên chọn phiên bản nào để xếp hạng cho kết quả tìm kiếm.
Khi xuất hiện nội dung trùng lặp, người quản trị web đối mặt với vấn đề mất thứ hạng, giảm traffic, và SE sẽ đưa ra kết quả tìm kiếm kém chính xác hơn.

Nguyên nhân gây trùng lặp nội dung:

Việc nhận diện nội dung trùng lặp không hẳn toàn bộ nội dung và tiêu đề nói cùng một ý, một câu chữ. Các công cụ tìm kiếm đánh giá nội dung trùng lặp thông qua một số yếu tố chính sau:

1. Các tham số của URL

Các thông số URL như theo dõi nhấp chuột và một số mã phân tích có thể gây ra các vấn đề nội dung trùng lặp.

2. Phiên bản in ấn

Các phiên bản để in ấn của một nội dung có thể gây ra duplicate content khi nhiều phiên bản của trang được xếp hạng.

3. Senssion IDs

Các senssion IDs là nguyên nhân chủ yếu gây ra nội dung trùng lặp. Việc này xảy ra khi mỗi người dùng vào website và để lại 1 senssion ID và được lưu lại ở URL.

4. Copy nội dung:

  • Trùng lặp hoàn toàn: Là trường hợp rõ ràng nhất khi nội dung bị sao chép 100% chỉ khác nhau duy nhất là Url.
  • Trùng lặp một phần: Là trường hợp gần giống bản gốc nhất chỉ khác nhau về bố cục, hình ảnh và chút ít về từ ngữ.
  • Cross Domain: Là trường hợp giống 1 phần nội dung, thường là được lấy từ bản gốc rồi đăng làm nhiều phần trên những website khác nhau.

5. Phân trang comment.

Một số website khi có lượng comment lớn đã ngắt thành những trang khác nhau (/cmt-page-1/, /cmt-page-2/) khi cùng trỏ về một nội dung.

6. Non www và www

Có nhiều SEOer khi không để ý điều này. Vô hình chung đã đẩy website vào Duplicate Content Website trùng lặp nội dung sẽ bị phạt bởi SE, SE sẽ loại bỏ (tùy theo mức độ) kết quả tìm kiếm trên trang kết quả đối với các trang có quá nhiều nội dung trùng lặp nội dung.

>> Các hình phạt có thể xảy ra ở website của bạn?

Các kết quả tìm kiếm của bạn sẽ bị loại bỏ (tùy mức độ xử phạt) trên trang tìm kiếm. Đối với các trang có quá nhiều nội dung trùng lặp nội dung, website của bạn có thể bị đánh bay khỏi các mạng tìm kiếm... Bạn thử nghĩ xem, mình trồng cây lâu năm đến ngày thu hoạch thì bị chặt gốc sẽ như thế nào? buồn thiệt chứ!

Mới đây (16/12/2013) Matt Cutts người đứng đầu bộ phận hỗ trợ SEO và chống SPAM của trang mạng tìm kiếm nổi tiếng nhất thế giới Google đã đăng 1 video trên Youtube có nhắc đến việc trùng lặp nội dung hiện nay. Matt có nói rằng Google không có quyền xử phạt các trang web có nhiều nội dung trùng lặp, nhưng chắc chắn một điều rằng những nội dung này sẽ không có thứ hạng cao trên bảng hiện thị kết quả của Google.

Cách khắc phục triệt để khi bị trùng lặp nội dung

Có rất nhiều cách khắc phục lỗi Duplicate Content, điều quan trọng nhất là chúng ta phải hiểu "làm thế nào để chuyển tải nội dung trên web phù hợp và mang lại lợi ích đến khách hàng. Ngoài những cách khắc phục đối phó với các công cụ tìm kiếm như "chuyển hướng 301, Rel="canonical", chúng tôi khuyến cáo các bạn nên dựa trên ý chính và viết nội dung (bàn luận, chỉnh sửa...) theo chính kiến riêng của mình. Nên đặt các câu hỏi hoặc câu cảm thán, đồng thời bỏ lơ, kick thích sự tò mò tới người đọc...

Dưới đây là những cách đơn giản khắc phục lỗi noi dung trung lap:

  • Chuyển hướng 301

Trong nhiều trường hợp, cách tốt nhất để chống lại nội dung trùng lặp là thiết lập một trang chuyển hướng 301 từ trang "bản sao" các trang nội dung ban đầu. Khi các trang với nhiều khả năng được xếp hạng tốt được kết hợp thành một trang duy nhất, chúng không còn cạnh tranh với nhau, mà tạo ra một sự liên quan mạnh mẽ hơn và tín hiệu phổ biến tổng thể. Điều này sẽ tác động tích cực đến khả năng được xếp hạng tốt trong công cụ tìm kiếm.

  • Rel="canonical"

Một tùy chọn khác để đối phó với nội dung trùng lặp là sử dụng rel = canonical tag. Các rel = canonical đi cùng một link juice (ranking power) cũng giống như là một chuyển hướng 301, và để thực hiện thì thường mất it thời gian hơn.

Mẫu code Rel=Canonical:


<link href="http://www.adtechjsc/about/" red="canonical"></link>

Dươi đây là thẻ link và tất cả các liên kết, số liệu thống kê được áp dụng thay thế. Đây là thẻ được hiểu là một phần của HTML head trong một trang web. Thẻ meta này không phải là mới, nhưng như nofollow, chỉ cần sử dụng một tham số rel mới.

Ví dụ:

<link href="http://www.example.com/canonical-version-of-page/" rel="canonical"></link>


Bản quyền thuộc về adtechjsc.com. Vui lòng trỏ link về bài viết gốc, ghi rõ nguồn http://www.adtechjsc.com hoặc tên tác giả viết bài nếu các bạn copy bài viết này



Có thể bạn quan tâm!


Web 500k - Web 1 triệu - Thiết kế web doanh nghiệp - Thiết kế web tin tức - Web bán hàng


Công ty Cổ Phần ADTECH - Địa điểm chuyên SEO Web, Thiết kế Website tại Thanh Hóa

Địa chỉ trụ sở chính: 551 - Quang Trung 2. P. Dong Ve. TP.TH

(Chuyển đổi - Công ty CP VinaBeach) VPGD: 551 - Quang Trung 2 - P. Đông Vệ - Thanh Phố Thanh Hóa

VPGD Hà Nội: Tầng 3, Tòa Nhà Tuancuong Group, Số 43/408, Ngô Gia Tự, Q. Long Biên, HN

Hotline: O89.66.5.66.36

Email: [email protected]

Mọi thông tin chi tiết xin liên hệ để được giải đáp. Xin chân thành cảm ơn sự quan tâm của quý vị.

Copyright © ADTechJsc. All right reserved.