Trang chủ » làm thế nào để » URL (Bộ định vị tài nguyên thống nhất) là gì?

    URL (Bộ định vị tài nguyên thống nhất) là gì?

    Khi bạn nhập một địa chỉ vào trình duyệt web của bạn, rất nhiều điều xảy ra đằng sau hậu trường. Và hầu hết điều đó được xác định bởi các phần khác nhau của URL bạn đã nhập. Hãy xem xét kỹ hơn.

    Một URL có thể bao gồm một loạt các phần khác nhau. Có một tên máy chủ ánh xạ tới một địa chỉ IP của một tài nguyên cụ thể trên internet và một loạt thông tin bổ sung cho trình duyệt của bạn và máy chủ biết cách xử lý mọi thứ. Bạn có thể nghĩ về một địa chỉ IP giống như một số điện thoại. Tên máy chủ giống như tên của một người có số điện thoại bạn muốn tìm. Và một tiêu chuẩn được gọi là Hệ thống tên miền (DNS) hoạt động ở chế độ nền giống như một danh bạ điện thoại, dịch các tên máy chủ thân thiện với con người hơn thành các địa chỉ IP mà các mạng sử dụng để định tuyến lưu lượng.

    Hãy ghi nhớ sự tương tự đó, chúng ta hãy xem cấu trúc của một URL và cách nó hoạt động để đưa bạn đến nơi bạn muốn đến.

    Cách cấu trúc của một URL

    Cấu trúc của URL được xác định đầu tiên bởi Sir Tim Berners-Lee - người đã tạo ra Web và trình duyệt web đầu tiên - vào năm 1994. Về cơ bản, URL kết hợp ý tưởng về tên miền với ý tưởng sử dụng đường dẫn tệp để xác định một đường dẫn cụ thể cấu trúc thư mục và tập tin. Vì vậy, nó tương tự như sử dụng một đường dẫn như C: \ Documents \ Personal \ myfile.txt trong Windows, nhưng với một số nội dung bổ sung lúc đầu để giúp tìm đúng máy chủ trên internet nơi đường dẫn đó tồn tại và giao thức được sử dụng để truy cập vào thông tin.

    Một URL bao gồm một số phần khác nhau. Lấy ví dụ: một URL cơ bản như URL được hiển thị trong hình bên dưới.

    URL đơn giản đó được chia thành hai thành phần chính: lược đồ và quyền hạn.

    Kế hoạch

    Nhiều người nghĩ rằng URL chỉ là một địa chỉ web, nhưng nó không hoàn toàn đơn giản. Địa chỉ web là một URL, nhưng tất cả các URL không phải là địa chỉ web. Các dịch vụ khác mà bạn có thể truy cập trên Internet - như FTP - hoặc thậm chí như MAILTO - cũng là URL. Phần lược đồ của một URL (các chữ cái được theo sau bởi dấu hai chấm) biểu thị giao thức mà ứng dụng (như trình duyệt web của bạn) và máy chủ sẽ giao tiếp.

    Địa chỉ web là URL phổ biến nhất, nhưng có những địa chỉ khác. Vì vậy, bạn có thể thấy các chương trình như:

    • Giao thức truyền tải siêu văn bản (HTTP): Đây là giao thức cơ bản của web và xác định những hành động mà máy chủ và trình duyệt web nên thực hiện để đáp ứng với các lệnh nhất định.
    • Bảo mật HTTP (HTTPS): Đây là một dạng HTTP hoạt động trên lớp bảo mật, được mã hóa để vận chuyển thông tin an toàn hơn.
    • Giao thức truyền tệp (FTP): Giao thức này vẫn thường được sử dụng để truyền tệp qua internet.

    Trong các trình duyệt hiện đại, lược đồ không bắt buộc về mặt kỹ thuật như là một phần của URL. Nếu bạn vào một trang web như thế giới www.howtogeek.com, thì trình duyệt của bạn sẽ tự động xác định đúng giao thức để sử dụng. Tuy nhiên, một số ứng dụng (và giao thức) khác yêu cầu sử dụng lược đồ.

    Thẩm quyền

    Phần thẩm quyền của một URL (trước hai dấu gạch chéo) tự nó được chia thành một loạt các phần. Hãy bắt đầu với một URL rất đơn giản - loại sẽ đưa bạn đến trang chủ của trang web.

    Trong ví dụ đơn giản này, toàn bộ phần www.example.com của người được gọi là tên máy chủ và nó được phân giải thành địa chỉ IP. Bạn cũng có thể nhập địa chỉ IP vào thanh địa chỉ của trình duyệt thay vì tên máy chủ nếu bạn tình cờ biết địa chỉ đó.

    Nhưng, khi phân tích tên máy chủ, nó giúp đọc ngược để hiểu những gì đang diễn ra, vì vậy đây là các thành phần:

    • Tên miền cấp cao: Trong ví dụ ở đây, miền com com là tên miền cấp cao nhất. Đây là mức cao nhất trong hệ thống phân cấp Hệ thống tên miền (DNS) được sử dụng để dịch địa chỉ IP thành địa chỉ ngôn ngữ đơn giản mà con người chúng ta dễ nhớ hơn. Các tên miền cấp cao nhất này được Tập đoàn Internet tạo và quản lý cho Tên và số được gán (ICANN). Ba tên miền cấp cao phổ biến nhất là .com, .net và .gov. Hầu hết các quốc gia cũng có tên miền cấp cao nhất gồm hai chữ cái, vì vậy bạn sẽ thấy các tên miền như .us (Hoa Kỳ), .uk (Vương quốc Anh), .ca (Canada) và nhiều tên miền khác. Ngoài ra còn có một số tên miền cấp cao bổ sung (như .museum) được tài trợ và quản lý bởi các tổ chức tư nhân. Ngoài những thứ này, còn có một số tên miền cấp cao chung chung (như .club, .life và .news).
    • Tên miền phụ: Vì DNS là một hệ thống phân cấp, nên cả hai phần của ví dụ về www www và ví dụ của URL của ví dụ của chúng tôi đều được coi là tên miền phụ. Phần của www www là một tên miền phụ của tên miền cấp cao nhất com com và phần www www là một tên miền phụ của tên miền Ví dụ. Đó là lý do tại sao bạn sẽ thường thấy một công ty có tên đã đăng ký như là Google google.com. Được chia thành các tên miền phụ riêng biệt như Khăn www.google.com, tin tức, các ứng dụng, Sớm.

    Đó là ví dụ cơ bản nhất về phần thẩm quyền của URL, nhưng mọi thứ có thể trở nên phức tạp hơn. Có hai thành phần khác mà phần thẩm quyền có thể chứa:

    • Thông tin người dùng: Phần quyền cũng có thể chứa tên người dùng và mật khẩu cho trang web bạn đang truy cập. Thật hiếm khi thấy cấu trúc này trong các URL ngày hôm nay, nhưng nó có thể xảy ra. Nếu có, phần thông tin người dùng xuất hiện trước tên máy chủ và được theo sau bởi dấu @. Vì vậy, bạn có thể thấy một cái gì đó giống như // //ername :[email protected] 'nếu nó bao gồm thông tin người dùng.
    • Số cổng: Các thiết bị mạng sử dụng địa chỉ IP để nhận thông tin đến đúng máy tính trên mạng. Khi lưu lượng truy cập đến, một số cổng cho máy tính biết ứng dụng mà lưu lượng đó được dự định. Số cổng là một yếu tố khác bạn sẽ không thường thấy khi duyệt web, nhưng bạn có thể thấy nó trong các ứng dụng mạng (như trò chơi) yêu cầu bạn nhập URL. Nếu URL bao gồm số cổng, nó xuất hiện sau tên máy chủ và được đặt trước dấu hai chấm. Nó sẽ trông giống như thế này: xông //www.example.com:8080.

    Vì vậy, đó là phần lược đồ và quyền hạn của một URL, nhưng như bạn có thể đoán được sau khi xem rất nhiều URL trong khi duyệt web, chúng có thể bao gồm nhiều nội dung hơn.

    Đường dẫn, Truy vấn và Mảnh vỡ

    Có ba phần bổ sung của URL mà bạn có thể thấy sau phần quyền: đường dẫn, truy vấn và đoạn. Đây là cách chúng hoạt động.

    Con đường

    Phần quyền của URL đưa trình duyệt của bạn (hoặc bất kỳ ứng dụng nào) đến đúng máy chủ trên mạng. Đường dẫn tiếp theo - hoạt động giống như một đường dẫn trong Windows, macOS hoặc Linux - đưa bạn đến đúng thư mục hoặc tệp trên máy chủ đó. Đường dẫn đi trước dấu gạch chéo và có một dấu gạch chéo giữa mọi thư mục và thư mục con, như thế này:

    www.example.com/folder/subfolder/filename.html

    Phần cuối cùng là tên của tệp được mở khi bạn truy cập trang web. Mặc dù bạn có thể không nhìn thấy nó trong thanh địa chỉ, điều đó không có nghĩa là nó không ở đó. Một số ngôn ngữ được sử dụng để tạo các trang web ẩn tên tệp và phần mở rộng bạn đang xem. Điều này làm cho URL dễ nhớ và gõ hơn và cung cấp cho nó một cái nhìn rõ ràng hơn.

    Truy vấn

    Phần truy vấn của URL được sử dụng để xác định những thứ không phải là một phần của cấu trúc đường dẫn nghiêm ngặt. Thông thường, bạn sẽ thấy chúng được sử dụng khi bạn thực hiện tìm kiếm hoặc khi một trang web cung cấp dữ liệu thông qua một biểu mẫu. Phần truy vấn được đặt trước dấu chấm hỏi và xuất hiện sau đường dẫn (hoặc sau tên máy chủ nếu không bao gồm đường dẫn).

    Ví dụ: lấy URL này được trình bày khi chúng tôi tìm kiếm từ khóa Amazon với các từ khóa wi-fi Extender:

    https://www.amazon.com/s/ref=nb_sb_noss_2?url=search-alias%3Daps&field-keywords=wi-fi+extender

    Mẫu tìm kiếm đã chuyển thông tin đến công cụ tìm kiếm của Amazon. Theo dấu chấm hỏi, bạn có thể thấy có hai phần của truy vấn: một URL cho tìm kiếm (đó là url url = tìm kiếm bí danh% 3Daps & lĩnh vực Phần) và các từ khóa chúng tôi đã nhập (đó là từ khóa của từ = wi-fi + phần mở rộng.

    Đó là một ví dụ khá đơn giản và bạn sẽ thường thấy các URL có các biến bổ sung (và phức tạp hơn). Ví dụ: đây là URL khi chúng tôi tìm kiếm từ khóa Google howtogeek phạm:

    https://www.google.com.vn/search?q=howtogeek&rlz=1C1GCEA_enUS751US751&oq=howtogeek&aqs=chrom tựa 69i57j69i60l4j0.1839j1j4 & sourceid = chrome & eg = UTF-8

    Như bạn có thể thấy, có một số thông tin khác nhau ở đó. Trong trường hợp này, bạn có thể thấy rằng có thêm thông tin cho biết ngôn ngữ tìm kiếm, trình duyệt chúng tôi đã sử dụng (Chrome) và thậm chí cả số phiên bản của trình duyệt.

    Miếng

    Thành phần cuối cùng của một URL mà bạn có thể thấy được gọi là một đoạn. Đoạn này được bắt đầu bằng dấu băm (#) và được sử dụng để chỉ ra một vị trí cụ thể trên trang web. Khi mã hóa một trang web, các nhà thiết kế có thể tạo ra các neo cho văn bản cụ thể như tiêu đề. Khi đoạn thích hợp được sử dụng ở cuối URL, trình duyệt của bạn sẽ tải trang và sau đó nhảy đến neo đó. Các neo và URL có các đoạn thường được sử dụng để tạo các bảng nội dung trên các trang web để giúp điều hướng dễ dàng hơn.

    Đây là một ví dụ. Trang Wikipedia về Phục hưng là một tài liệu khá dài và được chia thành khoảng 11 phần, mỗi phần có nhiều phần phụ. Nhưng mỗi tiêu đề trên trang có một neo bao gồm và một mục lục ở đầu bài viết bao gồm các liên kết cho phép bạn chuyển đến các phần khác nhau. Những liên kết này hoạt động bằng cách bao gồm các đoạn.

    Bạn cũng có thể sử dụng các đoạn này trực tiếp trong thanh địa chỉ của bạn hoặc dưới dạng liên kết có thể chia sẻ. Ví dụ, bạn muốn cho ai đó xem phần của trang đó bao gồm Nga. Bạn chỉ có thể gửi cho họ liên kết này:

    https://en.wikipedia.org/wiki/Renaione#Russia

    Phần đó #Russia mà ở cuối URL sẽ đưa họ thẳng đến phần đó sau khi tải trang.


    Vì vậy, bạn có nó - nhiều hơn bạn có thể muốn biết về cách URL hoạt động.

    Tín dụng hình ảnh: Pawel Horazy / Shutterstock