Trang chủ : Trung tâm Trợ giúp : Đáp án

Q: Sự khác biệt giữa các tập tin nhị phân và văn bản là gì?

A: Tất cả các tệp có thể được phân loại thành một trong hai định dạng tệp - nhị phân hoặc văn bản. Hai loại tệp có thể trông giống nhau trên bề mặt, nhưng chúng mã hóa dữ liệu khác nhau. Trong khi cả hai nhị phân và tệp văn bản chứa dữ liệu được lưu trữ dưới dạng một chuỗi bit (giá trị nhị phân 1s và 0), bit trong tệp văn bản đại diện cho các ký tự, trong khi các bit trong tệp nhị phân đại diện cho tùy chỉnh dữ liệu.

Mặc dù các tệp văn bản chỉ chứa dữ liệu văn bản, các tệp nhị phân có thể chứa cả dữ liệu nhị phân tùy chỉnh và văn bản.

Tệp nhị phân

Các tệp nhị phân thường chứa một chuỗi bytehoặc đặt hàng nhóm tám bit. Khi tạo định dạng tệp tùy chỉnh cho chương trình, nhà phát triển sắp xếp các byte này thành định dạng lưu trữ thông tin cần thiết cho ứng dụng. Các định dạng tệp nhị phân có thể bao gồm nhiều loại dữ liệu trong cùng một tệp, chẳng hạn như dữ liệu hình ảnh, video và âm thanh. Dữ liệu này có thể được giải thích bằng các chương trình hỗ trợ, nhưng sẽ hiển thị dưới dạng văn bản bị cắt xén trong trình chỉnh sửa văn bản. Dưới đây là một ví dụ về một . PNG tập tin hình ảnh được mở trong một trình xem hình ảnh và một trình soạn thảo văn bản.

Image Viewer Trình soạn thảo văn bản
Hoa - Trình xem ảnh Hoa - Biên tập văn bản

Như bạn có thể thấy, trình xem ảnh nhận ra dữ liệu nhị phân và hiển thị ảnh. Khi hình ảnh được mở trong trình chỉnh sửa văn bản, dữ liệu nhị phân được chuyển đổi thành văn bản không thể nhận dạng được. Tuy nhiên, bạn có thể nhận thấy rằng một số văn bản có thể đọc được. Điều này là do định dạng PNG bao gồm các phần nhỏ để lưu trữ dữ liệu văn bản. Trình chỉnh sửa văn bản, mặc dù không được thiết kế để đọc định dạng tệp này, vẫn hiển thị văn bản này khi tệp được mở. Nhiều loại tệp nhị phân khác bao gồm các phần của văn bản có thể đọc được. Do đó, có thể tìm ra một số thông tin về loại tệp nhị phân không xác định bằng cách mở nó trong trình soạn thảo văn bản.

Các tệp nhị phân thường chứa các tiêu đề, là các byte dữ liệu ở đầu tệp xác định nội dung của tệp. Tiêu đề thường bao gồm loại tệp và thông tin mô tả khác. Ví dụ: trong hình trên, văn bản "PNG" cho biết tệp là hình ảnh PNG. Nếu một tệp có thông tin tiêu đề không hợp lệ, các chương trình phần mềm có thể không mở tệp hoặc họ có thể báo cáo rằng tệp bị hỏng.

Tệp văn bản

Các tệp văn bản hạn chế hơn các tệp nhị phân vì chúng chỉ có thể chứa dữ liệu văn bản. Tuy nhiên, không giống như các tệp nhị phân, chúng ít có khả năng bị hỏng. Mặc dù một lỗi nhỏ trong tệp nhị phân có thể khiến nó không thể đọc được, nhưng một lỗi nhỏ trong tệp văn bản có thể chỉ hiển thị khi tệp được mở. Đây là một trong những lý do Microsoft chuyển sang sử dụng văn bản nén XML định dạng cho Các loại tệp Office 2007.

Các tệp văn bản có thể được lưu trong một văn bản thô (. TXT) định dạng và văn bản phong phú (RTF) định dạng. Một tệp văn bản đơn giản điển hình chứa một số dòng văn bản, mỗi dòng được theo sau bởi một ký tự Cuối dòng (EOL). Điểm đánh dấu kết thúc tệp (EOF) được đặt sau ký tự cuối cùng, báo hiệu kết thúc tệp. Các tệp văn bản có định dạng sử dụng cấu trúc tệp tương tự, nhưng cũng có thể bao gồm các kiểu văn bản, chẳng hạn như in đậm và in nghiêng, cũng như thông tin định dạng trang. Cả văn bản thuần túy và tệp văn bản có định dạng đều bao gồm lược đồ (mã hóa ký tự | mã hóa ký tự) để xác định cách các ký tự được diễn giải và ký tự nào có thể được hiển thị.

Vì các tệp văn bản sử dụng định dạng chuẩn, đơn giản, nhiều chương trình có khả năng đọc và chỉnh sửa tệp văn bản. Chung biên tập văn bản bao gồm Microsoft Notepad và Wordman, được gói cùng với Windows và Apple TextEdit, được bao gồm trong Mac OS X.

Tệp không xác định

Nếu bạn gặp một loại tệp không xác định, trước tiên hãy tìm kiếm mở rộng tập tin trên taptin.info. Nếu tệp không có phần mở rộng hoặc bạn không thể định vị loại tệp, bạn có thể thử mở tệp trong trình chỉnh sửa văn bản. Nếu tệp mở và hiển thị văn bản hoàn toàn có thể đọc được, thì đó là tệp văn bản mà bạn đã mở thành công.

Nếu tệp mở và hiển thị hầu hết văn bản bị cắt xén, thì đó là tệp nhị phân. Mặc dù tệp không có nghĩa là được mở trong trình soạn thảo văn bản, nhưng có thể có một số manh mối trong văn bản tiết lộ thông tin về loại tệp, như trong ví dụ PNG ở trên. Điều này có thể giúp bạn xác định chương trình nào bạn cần để mở tệp chính xác. Cuối cùng, nếu tệp sẽ không mở trong trình soạn thảo văn bản, thì đó là tệp nhị phân chỉ có thể được mở bởi chương trình thích hợp.

Cập nhật: ngày 21 tháng 2011 năm XNUMX