Sistemas informáticos multiusuario e en rede/Representación de son
Sistemas informáticos multiusuario e en rede | ||
← Volver a Representación de imaxe | Representación de son | Seguir con Representación de vídeo → |
Introdución ao son
editarO son é o froito das vibracións que os obxectos producen no aire e que chegan aos nosos oídos en forma de ondas. Toda onda caracterízase por:
- Frecuencia. É a cantidade de veces por unidade de tempo que se produce unha onda completa. No caso do son, é a diferencia entre sons agudos ou graves.
- Amplitude. É a "altura" máxima que pode acadar unha onda. No caso do son, é o que determina o volume do mesmo.
- Timbre. No caso dos sons, permite distinguir o emisor do son. Por exemplo, o timbre da voz de dúas persoas será (con toda probabilidade) distinto. Isto é porque os obxectos emiten moitas ondas moi similares que resultan nunha onda final que ten unha forma concreta, o timbre.
Dixitalización do son
editarO primeiro paso para comprender o modo en que se representa o son na informática, é comprender que este son é distinto do son "normal": o son analóxico. Así, mentres que o son analóxico está formado por un sinal continuo, o dixital, en contraposición, trátase dun "sinal discreto" (a saltos, para entendermos).
O proceso para transformar un sinal analóxico nun dixital consta dunha serie de pasos:
Mostraxe
editarConsiste en tomar mostras do sinal analóxico cada certo tempo ─un certo número de veces por segundo─. O resultado é o que se chama frecuencia de mostraxe.
Frecuencia de mostraxe
editarA frecuencia de mostraxe mídese en hertzios (Hz), que equivale á cantidade de veces por segundo que se toman as mostras. Canto maior sexa a frecuencia, maior será a calidade do son dixitalizado.
O oído humano só é capaz de percibir sons que teñan unha frecuencia no rango entre 20 Hz e 20.000 Hz. Determinouse que a frecuencia máis axeitada para dixitalizar sons e que estes sexan posteriormente escoitados polo oído humano é de 44.100 Hz (44,1 KHz). Isto é algo máis do dobre da frecuencia máxima do sinal orixinal, e ven determinado polo teorema de Nyquiat , que di que de utilizarmos unha frecuencia de mostraxe menor ao dobre da frecuencia do sinal prodúcese unha perda da forma do sinal orixinal.
Cuantificación
editarConsiste en asignarlle a cada unha das mostras un nivel de son. Cantos máis estados posibles teñamos, máis se parecerá o sinal froito da mostraxe ao sinal orixinal.
Codificación
editarConsiste en asignarlle un código binario a cada un dos niveis de son detectados previamente. O tamaño do código binario dependerá directamente da cantidade de estados posibles que se elixisen na fase de cuantificación.
Canles
editarAs canles de son a cantidade de fluxos de son que comporán finalmente o ficheiro de son. Existen diversas opcións:
- Mono. Utilízase unha única canle.
- Estéreo. Utilízanse dúas canles para almacenar o son.
- Poden utilizarse máis canles:
- 2.1. Utilízase unha canle para cada altofalante regular (esquerdo e dereito) e unha terceira canle para o altofalante subwoofer (para os sons máis graves).
- 3.1. Coma o 2.1 pero cun altofalante central adicional.
- 5.1. Coma o 3.1, pero con dous altofalantes posteriores (esquerdo e dereito) para conseguir o chamado "efecto envolvente".
- 6.2. Coma o 5.1, pero cun altofalante central posterior e un altofalante subwoofer adicional.
Formatos de son
editarFormatos de son sen compresión
editarO CD-AUDIO é un formato de ficheiros de son de alta calidade. Utiliza unha frecuencia de mostraxe de 44100 Hz, 16 bits para codificar cada mostra, e en formato estéreo (dúas canles). Isto significa que cada minuto neste formato ocupa 10 MB.
O formato WAV (do inglés Waveform Audio Format, "formato de son en forma de onda") é un formato propiedade de Microsoft e de IBM. Se ben pode utilizar códecs, xeralmente utilízase sen compresión. O tamaño dos ficheiros neste formato está limitado a 4 GiB.
Formatos de son con compresión
editarO WMA (do inglés Windows Media Audio, "son do Windows Media") é un formato de compresión de son propiedade de Microsoft.
O MP3 (MPEG-1 Audio Layer 3) é un formato patentado de transmisión e compresión de son. Utiliza un método de lonxitude variable para codificar o ficheiro de son que consiste en asignar combinacións curtas aos estados máis frecuentes, e as combinacións máis longas para os menos frecuentes.
OGG Vorbis é un formato libre de son orientado a transmisións que aplica un códec ao ficheiro orixinal.
Dolby Digital AC3 é un formato de son que comprime a información do son orixinal baseándose en eliminar as partes do son que o oído non é capaz de percibir, por exemplo mediante "enmascaramento" ─técnica que consiste en eliminar o ruído producido entre sons de frecuencias similares─. Utiliza 5.1 canles.
Formatos de son descritivo
editarO formato de son descritivo MIDI (Musical Instrument Digital Interface, "interface dixital para instrumentos musicais") xorde coa aparición dos sintetizadores dixitais[1]. Trátase dunha especie de linguaxe musical que permite estandarizar as notas producidas polos distintos instrumentos musicais. Non almacena o son mediante mostraxe, cuantificación e codificación, senón que se codifican os instrumentos, as notas musicais e mailas súas características.
O dispositivo que vai reproducir os ficheiros MIDI (extensión .mid
) pode dispoñer do son dos instrumentos reais ou xeralos a parires dun sintetizador. Mediante programas específicos pódense editar os parámetros e realizar cambios no ficheiro de son.
Ocupan moito menos espazo que os ficheiros de son "real".
Algúns conceptos
editar- Transmisión (streaming). É unha técnica que permite escoitar ou visualizar un ficheiro a través dunha rede sen necesidade de descargalo enteiro previamente. Para evitar cortes na reprodución, vaise cargando previamente un búfer.
- Códec (codificador decodificador). É unha técnica de compresión mediante software que codifica e posteriormente decodifica un sinal de son ou vídeo mediante unhas bibliotecas de rutinas e datos.
- Densidade de bits. É a cantidade de bits por segundo que se utilizarán para almacenar a información nun ficheiro de son. Mídese en quilobits por segundo (kbps). Pódese utilizar coma unha media para realizar a compresión. A densidade pode ser constante (CBR) cando esta é igual ao longo de todo o ficheiro de son, ou variable (VBR) cando cambia nalgunhas partes en función da súa complexidade.
- Enmascaramento. É unha técnica que permite eliminar sinais de baixa potencia que teñan frecuencias similares a outros de maior potencia.
Notas
editar- ↑ Un sintetizador dixital é un dispositivo dixital que xera sons.
Sistemas informáticos multiusuario e en rede | ||
← Volver a Representación de imaxe | Representación de son | Seguir con Representación de vídeo → |