Phân biệt một số định dạng âm thanh

1. Âm thanh số là gì?
 
Âm thanh được ghi trên đĩa CD và định dạng file âm thanh WAV được sử dụng chuẩn định dạng pulse-code modulation (PCM) (tạm dịch là điều biến nhịp, nghĩa là trong analog ta thấy một tần số sine diễn tả âm thanh, nhưng trong kĩ thuật số ta không thể có sóng sine mà người ta sử dụng những "nhịp đập" cao thấp khác nhau một cách liên tục để diễn tả gần đúng nhất hình dạng sóng sine"). Đây là những tín hiệu âm thanh gốc và hoàn toàn không được nén.

Theo chuẩn PCM,
mỗi giây âm thanh được lấy mẫu với tần số lấy mẫu 44.1KHz, và mỗi mẫu được diễn tả bởi 16 bit dữ liệu. Có nghĩa là trong 1 phút nhạc/âm thanh ta có:
44.100 đợt lấy mẫu .2 kênh trái phải .2 bytes (16 bit = 2 bytes) .60 giây = 10.584.000 bytes = 10.1 MB


Như ta đã biết, một CD thường có dung lượng là 750Mb, hoặc lưu được 74 phút nhạc, vì thế nếu bạn nhân con số 10MB của mỗi phút nhạc cho 74 bạn sẽ thấy rõ tại sao CD nó lại như vậy.

Vậy tóm lại, 1 giây của âm thanh gốc sẽ có bitrate là
1411kbps.

2. Định dạng âm thanh phổ biến


(a) Lossy compression (Nén, bị mất dữ liệu): mp3, wma, ...

Với sự phát triển của PC và internet, nhu cầu chia sẻ thông tin và nhạc càng ngày càng được đòi hỏi cao. Nhưng thật bất tiện khi gửi cả album nhạc đến 700MB qua internet với tốc độ èo uột 56kps thời đấy được. Do đó các nhóm nghiên cứu, các tổ chức và nhiều công ty khác nhau đã cố gắng tìm ra những định dạng âm thanh mới sử dụng những thuật toán riêng để nhằm giảm bớt dung lượng dữ liệu cần đề diễn tả âm thanh gốc, cùng lúc đó cố gắng giữ cho âm thanh gần với âm thanh gốc nhất.

Có rất nhiều định dạng khác nhau đã ra đời như
mp3, wma, aac, ogg, mpc, atrac, ... Chúng hoạt động gần giống nhau nhưng mỗi định dạng có một thuật toán khác nhau để xác định xem giữ lại mẫu âm thanh nào, bỏ mẫu âm thanh nào, hoặc điều chỉnh mẫu âm thanh thế nào.

Thế thì tại sao lại có thể bỏ, hoặc giữ lại? Vì theo lí thuyết, tai con người sẽ rất khó nhận ra sự hiện diện của một tần số âm thanh nhất định nào đó (có thể là quá
20Khz). Việc bỏ đi
một phần dữ liệu âm thanh này giúp cho các định dạng âm thanh mất dữ liệu như mp3 có thể giảm dữ liệu cần thiết để diễn tả một lần lấy mẫu (sẽ ít hơn rất nhiều so với 16bit cho 44.100 lần một giây như của âm thanh gốc).

Ngoài ra các định dạng âm thanh này còn tạo ra những âm thanh giả nhằm đắp vào những phần nó đã loại bỏ, điều này là thực sự không thể chấp nhận được. Nó tạo ra những âm thanh ta hay gọi là "eo éo" hoặc vang hoặc méo hẳn so với âm chuẩn. Những file được nén với bitrate càng thấp thì hiện tượng này xảy ra càng nhiều: ví dụ điển hình nhất là khi bạn hãy nghe thử một đoạn khán giả vỗ tay trong một file mp3 và một track trong CD gốc hoặc một file nén không mất dữ liệu (lossless) sẽ ngay lập tức nhận ra. Vì sao tiếng vỗ tay lại gây ra nhiều vấn đề như vậy? Bởi vì tiếng vỗ tay là âm thanh hỗn hợp ngẫu nhiên, nếu trong âm thanh chuẩn gốc nó sẽ được diễn tả đầy đủ, thế nhưng với âm thanh nén, định dạng nén buộc phải "ép" bitrate của mình vào khoảng cho phép do đó nó tạo ra những âm thanh vỗ tay đều đều nhau rất ít sự khác biệt hoặc bị hiệu ứng vang.

Chúng ta thường thấy rằng
mp3 hay được nén với bitrate là 128, 192, hoặc 320 kilobit/1 giây (kbps) . Bạn có thể nhận thấy rằng nó chỉ bằng 1/10 so với bitrate của WAV (1411kbps) đó là lí do tại sao 1 phút nhạc MP3 128kbps chỉ tốn khoảng 1MB.

Đúng là trong 1 số trường hợp nhất định, hoặc 1 dạng âm thanh/nhạc nào đó, sẽ rất khó phân biệt sự khác nhau giữa âm thanh gốc và MP3. Bên cạnh đó các thuật toán nén của các định nhạc mất dữ liệu đã được cải thiện rất nhiều. Thế nhưng không có gì hoàn hảo, và chắc chắn cái gì đã mất đi thì sẽ làm cho nó hỏng đi. Đặc biệt là âm thanh. Đối với những album nhạc như vocal, nhạc cụ, hay đặc biệt là cổ điển thì đây là 1 tai họa, vì với những album nhạc này, thường những nhạc cụ được sử dụng hoặc giọng hát có tần số âm thanh rất cao hay rất trầm do đó rất nhiều dự liệu đã bị loại bỏ hoặc điều chỉnh khác đi so với thực tế.

MP3, âm thanh nén, nhiều người cho rằng chỉ thích hợp với nhạc pop hoặc các dạng nhạc bình thường khác.

(b) Lossless Compression (Nén, không mất dữ liệu)

 
Trong công việc hàng ngày với máy tính, hẳn không ít lần bạn đã nén một file tài liệu gửi cho đồng nghiệp. Có thể bạn đã sử dụng Zip hoặc Rar làm định dạng nén.

File tài liệu được bạn nén sau khi qua Zip hoặc Rar sẽ trở nên nhỏ hơn rất nhiều nhưng khi người nhận nhận được file, họ sẽ giải nén và có được file tài liệu gốc mà bạn đã tạo. Vậy Zip và Rar đã làm gì? Nói đơn giản, đó là những thuật toán nhằm tìm ra những quy luật lặp của dữ liệu từ đó, tìm một cách hiển thị khác tối ưu hơn, tốn ít dữ liệu hơn. Ví dụ ta có chuỗi: aaaaa bbbbbbb aaa 11111, bạn thấy rằng cách diễn giải tốt hơn nhiều mà tốn ít chữ hơn là a.5 b.7 a.3 1.5. Đấy là một ví dụ rất đơn giản để bạn hiểu, còn thì nó phức tạp hơn rất nhiều.

Như vậy khi người nhận nhận file và giải nén, Zip và Rar đóng nhiệm vụ sử dụng những chuỗi dữ liệu nén đó tập hợp và tạo lại file gốc ban đầu.

Đó cũng là mục đích của định dạng âm thanh nén không mất dữ liệu (lossess). Với cấu trúc trên của zip hoặc rar thì bạn có thể thấy rõ rằng đối với lossless audio, nó lấy đầu vào là âm thanh gốc của CD, cố gắng tìm ra những quy luật âm thanh và nén nó lại. Việc nén lại này là không cao vì dữ liệu âm thanh rất đa dạng và sử dụng nhiều dữ liệu. Hiện tại mức độ nén cao nhất có thể của kĩ thuật nén không mất dữ liệu là bằng khoảng 1/3 dung lượng của âm thanh gốc. Do đó mỗi album lossless sẽ có dung lượng khoảng 200 đến 300 Mb.

Khi giải nén hoặc khi nghe lossless điều chắc chắn ta đạt được đó chính là tín hiệu gốc của âm thanh
CD (44.1Khz, 16bit, 1411Kbps). Điều này là cứu nhân cho mọi người yêu âm nhạc luôn đòi hỏi âm thanh trung thực nhưng không có điều kiện có CD gốc hoặc muốn sử dụng máy tính làm nơi lưu trữ albums.

- Hoạt động của việc ghi CD nhạc:
 
Như đã đề cập, định dạng âm thanh của CD là
PCM 1411kbps và đầu vào của nó cũng phải ở định dạng PCM 1411kbps. Do đó khi ta ghi một CD nhạc, việc đầu tiên của một chương trình ghi đĩa là nó phải convert (chuyển) bất kì định dạng đầu vào nào ra WAV, bất kể nó là mp3 hay ape, lossy hay lossless. Đó là lí do vì sao mà ngoài mp3 thường được hỗ trợ sẵn, đối với các định dạng âm thanh khác ta phải cần plugin cho trình ghi đĩa mới có thể ghi được.

Như thế bất kì định dạng nhập vào là gì trước khi ghi ra đĩa ta sẽ có một dữ liệu âm thanh định dạng WAV, mà WAV thì luôn là PCM 1411kbps. Cho nên dù dữ liệu vào "xấu" hay "đẹp" nó cũng sẽ được cho mặc
một cái áo được dệt bởi 1411 kí sợi để ghi ra CD. Tại sao cùng một album, ta có hai định dạng mp3 và ape, mp3 chỉ 50MB, ape đến 200MB mà ghi ra đĩa vẫn đầy, vẫn cùng ngần đấy phút nhạc? Đã có câu trả lời tại sao.

- Hoạt động của việc nén CD nhạc:
 
Như vậy sau khi ghi ra CD một rổ dữ liệu "xấu" đấy, nếu bạn sử dụng nó để đọc trong máy sẽ vẫn thấy rằng bitrate của nó là 1411kbps. Tiếp theo nếu bạn sử dụng phần mềm để rip CD (trích xuất CD thành từng track) này và xác định bitrate là 320 hay cao hơn đi nữa thì nó sẽ vẫn thực hiện công việc nén 1411kbps dữ liệu "xấu" đấy trở thành 320. Nhưng cũng phải nói thêm rằng dù nén 320kbps nhưng dữ liệu "xấu" của bạn sẽ càng trở nến xấu hơn vì chính trong lúc nén ở 320kbps, nó sẽ tiếp tục bị mất tiếp dữ liệu. Đã xấu lại càng xấu .

Vậy theo lí thuyết ở phần trước, để giữ nguyên độ "xấu" gốc bạn chỉ có cách nén ở định dạng lossless không mất dữ liệu ... "xấu".

Phần lớn, hay ko muốn nói là tất cả những đĩa nhạc copy (cả nhạc Việt lẫn nhạc ngoại) mà ta thấy ngoài tiệm đều là ghi ra đĩa với nguồn là MP3 trong máy tính. Bạn có rip với bất kì định dạng nào thì chất lượng vẫn là hàng phế phẩm, không nói gì chất lượng CD, mà chất lượng âm thanh không thể nào bằng đĩa gốc.

Vậy với lossless nó sẽ thế nào? Cũng vẫn thế, nhưng khi APE được trình ghi đĩa giải nén ra WAV ta sẽ có lại dữ liệu đẹp ban đầu ở 1411kbps, tạo ra 1 đĩa CD chuẩn ở 1411kbps, rồi ta lại rip lossless, rồi lại ghi ra. Cho dù bao nhiêu lần đi nữa thì dữ liệu vẫn (có thể) được giữ nguyên. Nói có thể là vì nó còn phụ thuộc nhiều vào chất lượng CD, chất lượng đầu đọc, hai thứ đó có đảm bảo được cho sự an toàn, hoàn chỉnh của dữ liệu khi ghi và đọc hay không. Vì thế mà người ta luôn nói là với CD thì phải là TDK, ổ đĩa thì phải là Plextor, hơn nữa khi ghi hay đọc thì chỉ ở tốc độ 1x , như thế mới giảm thiểu tối đa số lỗi đọc ghi.

Công nghệ ghi đĩa và loại đĩa được sử dụng là rất quan trọng do đó đĩa hiệu mới đắt như vậy. Ngoài ra còn có đủ loại đĩa dành cho dân audiophile như đĩa vàng, đĩa thủy tinh. Công nghệ thì có
XRCD, DCC, Chesky, MFSL ,... rất rất nhiều. Sự khác nhau của họ là cách thức xử lý tín hiệu gốc đạt đến độ hoàn chỉnh, sau đó sử dụng công nghệ máy móc được phát triển riêng để ghi lên đĩa đặc hiệu, máy ghi đĩa luôn đảm bảo rằng không có lỗi xảy ra, dữ liệu không bị nhiễu và khi ghi lên bề mặt đĩa đạt hiệu quả tối ưu.

 - Nén nhạc với định dạng Lossless:

Hiện tại có hai định dạng nhạc nén lossless phổ biến nhất là FLACAPE. Để trích xuất nhạc từ đĩa CD hoặc chuyển đổi định dạng nhạc sang FLAC hoặc APE bạn có thể sử dụng những phần mềm sau:
  • Exact Audio Copy (EAC): phần mềm tiêu chuẩn để rip nhạc. EAC là phần mềm tốt nhất để đảm bảo chất lượng nhạc chép vào là giống với CD nhất. 
  • Foobar2000: Chương trình chơi nhạc nén lossless hay nhất hiện tại. Bạn cũng có thể sử dụng chương trình để chuyển đổi định dạng hay rip từ CD. (Đối với định dạng FLAC, bạn cần download thêm tiện ích từ trang chủ của chương trình).
  • Monkey Audio Compressor: mẹ của APE. Dữ liệu chép vào chuẩn sẽ là WAV (như CD) sau đó MAC được gọi để nén lại thành APE.
(*) Kinh nghiệm cá nhân:
  • Nếu bạn không bị giới hạn về khả năng lưu trữ có thể sử dụng định dạng WAV. WAV được hỗ trợ bởi hầu hết các thiết bị âm thanh, tuy vậy không có khả năng lưu trữ thông tin như FLAC vâ APE (như tên bài hát, tác giả, album, ảnh...). Một file WAV có dung lượng khoảng gấp đôi một file FLAC/APE.
  • FLAC được hỗ trợ trong các thiết bị âm thanh phổ biến hơn APE. Nếu rip hoặc chuyển đổi file nhạc bạn nên chọn chế độ nén của FLAC thấp nhất, nhờ đó quá trình chuyển đổi sẽ diễn ra nhanh hơn (file nén FLAC ở chế độ cao nhất cho dung lượng file nhỏ không đáng kể đồng thời quá trình đọc file (ví dụ bởi foobar2000 sẽ mất thời gian hơn)). 
  • Nên lưu trữ toàn bộ kho nhạc của bạn dưới dạng lossless vào máy tính do đĩa CD có thể bị mất hoặc hỏng. Xu hướng âm nhạc tiếp theo sẽ lưu trữ số hóa hoàn toàn. Nếu lưu bằng FLAC, toàn bộ thông tin trên đĩa sẽ được lưu lại vào các tracks. Muốn chuyển đổi sang định dạng khác hoặc ghi ra đĩa sẽ rất dễ dàng. Với các thiết bị đầu đọc home cinema hỗ trợ USB, stream từ máy tính... thì việc quản lý và nghe nhạc với chất lượng cao sẽ tiện dụng hơn nhiều.  
Sưu tầm và bổ sung.

Read more ...

Website counter