LAS LENGUAS DEL MUNDO
ESQUEMA
1.
Presentación
5.
Familias lingüísticas y clasificación genético-tipológica
9.
Clasificación de las lenguas del mundo
10.
Distribución geográfica de
las lenguas del mundo
11.
Las 100 principales lenguas del
mundo
Aunque se sabe que el hombre ha utilizado
distintas lenguas para comunicarse casi desde el principio de la historia,
la falta total de testimonios hace imposible aun hoy en día conocer los orígenes
del lenguaje, proceso que quizá ocurrió hace un millón de años. Por lo
tanto, los lingüistas únicamente son capaces de estudiar su posterior evolución
a partir de un período histórico relativamente reciente. Lo que se obtiene
de esta manera es una foto incompleta de la evolución de las lenguas, ya
que las primeras muestras escritas hacen referencia a una serie de variantes
lingüísticas entre las que se producen semejanzas y diferencias, pero cuyo
origen se desconoce. Al igual que en el caso de la especie humana, algunas
tendencias de la lingüística moderna se inclinan a creer que todas las lenguas
del mundo evolucionaron a partir de una única, aunque esto no pasa de ser
una mera suposición que carece de la suficiente base científica para confirmarla.
Para poder empezar a estudiar las
lenguas del mundo, antes es necesario dar respuesta a una pregunta fundamental:
¿qué es una lengua? Desde un punto de vista cognitivo, una lengua es una
manifestación concreta del lenguaje humano, un
instrumento vivo de comunicación entre individuos de una misma comunidad
lingüística, una forma de expresar el pensamiento consciente, una herramienta
para la creación mental e intelectual y una puerta abierta al conocimiento;
pero a su vez hablar una lengua supone establecer una identidad personal dentro
de un grupo, por lo que en su naturaleza hay un equilibrio dinámico entre el
deseo de entender y ser entendido y la necesidad de ser distinto e individual.
Desde un punto de vista lingüístico, las lenguas del mundo pueden
entenderse como un continuo espacial que en ciertas regiones da lugar a
concentraciones más o menos homogéneas y estables de características
gramaticales, fonéticas y léxicas llamadas convencionalmente “lenguas” o
“idiomas” individuales, que permiten la intercomprensión básica de sus
hablantes. Si este fenómeno pudiera reflejarse físicamente en forma de
concentraciones luminosas y de color, una fotografía de la Tierra realizada
desde un satélite mostraría diversos puntos en el planeta, con mayor o menor
luminosidad e intensidad, que sólo en algunas regiones producirían la impresión
de formar grandes manchas homogéneas.
La primera interrogante que una
persona interesada en la materia plantea a la lingüística es la siguiente:
¿cuántas lenguas se hablan en la actualidad? Es ésta una pregunta complicada de
contestar, ya que el desarrollo e interrelación de las diferentes variedades
lingüísticas suscita gran cantidad de problemas. Aunque las sociedades modernas
tienden a categorizar la realidad mediante clasificaciones y estadísticas, las
lenguas se resisten a ser manejadas como elementos individuales por una serie
de razones, en muchos casos de carácter lingüístico aunque en otros también por
motivos sociopolíticos. Una respuesta muy aproximativa y conservadora a la
anterior pregunta es la que establece su número alrededor de cuatro mil, aunque
la mayoría de clasificaciones sitúan esta cantidad en las seis mil, sin
establecer distinciones demasiado estrictas entre “lengua” y “dialecto”. Las
principales dificultades que impiden dar una contestación más precisa a esta
cuestión son las siguientes:
a) Las lenguas habladas
en muchas partes del mundo no se hallan lo suficientemente estudiadas, por lo
que no se conoce con precisión su naturaleza. El ejemplo más claro lo
constituye Papúa-Nueva Guinea, país cuya situación lingüística era
prácticamente desconocida hasta hace pocos años, aunque hoy se sabe que en él
se hablan unas 750 lenguas distintas, es decir, casi una séptima parte del
total mundial.
b) Por otro lado, en muchos casos
resulta difícil —o sencillamente imposible— decidir si dos variedades
lingüísticas son lenguas distintas o simples dialectos de una misma. En ciertas
regiones geográficas, a medida que se pasa de una zona a otra las lenguas se
fusionan con otras adyacentes y entonces es complicado afirmar con total
seguridad cuál es la que se utiliza en un determinado territorio. El hecho de
que la distinción entre lenguas y dialectos se halle más claramente establecida
en Europa que en otras partes del mundo se debe básicamente a razones de tipo
político y social más que lingüístico.
c) Un tercer problema que se plantea
consiste en delimitar el período histórico en el que una variedad lingüística
ha evolucionado lo suficiente como para poder ser considerada una lengua
distinta. Es lo que ocurre, por ejemplo, en el caso del latín, del que descienden todas las
lenguas románicas (entre ellas el español). En general, las lenguas no nacen y
mueren en momentos puntuales como las personas, sino que se producen largos
períodos de convivencia y mutua interrelación. A este respecto, se ha propuesto
un modelo alternativo de evolución lingüística distinto al genealógico
tradicional conocido como “teoría de las ondas”, el cual sostiene que
las innovaciones lingüísticas se producen no por derivaciones lineales —del
tipo “lengua A evoluciona a lengua B, lengua B evoluciona a lengua C”, etc.—
sino como ondas que se propagan a partir de determinados centros, cruzándose a
menudo entre sí. Por tanto, las áreas próximas se asemejan más que las áreas
separadas, y las diferencias entre las lenguas aumentan con la distancia entre
sus respectivos dominios de influencia.
d) Una cuarta razón por la que resulta
complicado especificar el número total de lenguas habladas es el hecho de que
muchas de ellas se hallan en peligro inminente de extinción. Se estima que cada
año “mueren” diez lenguas en el mundo, y este proceso de desaparición se
acelera con el tiempo. La amenaza más patente que se cierne sobre gran cantidad
de lenguas indígenas consiste en su progresiva sustitución por otras de
carácter mayoritario e internacional (a cuya cabeza se halla sin duda el inglés). A diferencia de la evolución
lingüística, la extinción de una lengua es un proceso abrupto, que coincide con
la muerte de su último hablante nativo tras un lento proceso de abandono por
parte de su antigua comunidad. De forma parecida a las estrellas cuya luz aún
percibimos a pesar de que puedan haber desaparecido ya del universo, es posible
que algunas lenguas con un escaso número de hablantes puedan estar
desapareciendo en estos mismos instantes.
Algunos especialistas estiman que una
lengua sólo puede llegar a sobrevivir en el futuro si cuenta con más de cien
mil hablantes. Pero si se tiene en cuenta que, de las cerca de seis mil lenguas
que existen actualmente, aproximadamente la mitad es hablada por menos de diez
mil personas y una cuarta parte por menos de mil, estas previsiones no resultan
nada halagüeñas. Según los pronósticos más sombríos, entre el 50% y el 90% de
las lenguas habladas actualmente en el planeta desaparecerán en el transcurso
de los próximos cien años. El futuro de una variante lingüística en la
actualidad no depende únicamente de su número de hablantes, sino de su
importancia geográfica, social, cultural, tecnológica y política. Un claro
ejemplo lo constituyen lenguas clásicas como el latín y el sánscrito que, pese a ser técnicamente variedades
extintas —es decir, sin hablantes nativos—, por su valor histórico-cultural se
están intentando recuperar en universidades y emisoras de radio.
La desaparición de las lenguas no es
un fenómeno nuevo. Si se acepta la tesis genética de las variantes
lingüísticas, se estima que al menos treinta mil lenguas nacieron y se
extinguieron en diversas épocas históricas, algunas de ellas sin dejar huella.
En términos generales, la “longevidad” de las lenguas suele ser relativamente
breve; son escasos los idiomas que logran superar los dos mil años de
existencia (ejemplos destacados son el griego, el hebreo, el latín, el sánscrito, el chino, el persa... ¡y el euskera!). La disminución de la diversidad
lingüística se aceleró considerablemente a raíz de las conquistas coloniales
europeas a partir del siglo XVI, tras las cuales desaparecieron alrededor del
15% de las lenguas habladas en esa época. En Brasil, la colonización portuguesa
a partir de 1530 supuso la desaparición de unas 540 lenguas indígenas (cerca de
las tres cuartas partes del total). Tan sólo en Europa, se han extinguido unas
diez lenguas en el curso de los tres últimos siglos, mientras que en Australia
no quedan más de veinte de las 250 habladas a finales del siglo XVIII. El
nacimiento de los modernos “estados-nación”, cuya unidad territorial estaba
estrechamente ligada a su homogeneidad lingüística, fue un factor decisivo para
la consolidación de las lenguas adoptadas como nacionales y la marginalización
de las demás.
De las cerca de seis mil lenguas que
se hablan en el mundo, las principales distribuciones geográficas que se pueden
precisar con relativa seguridad son las siguientes: más de 1.000 lenguas
amerindias habladas en América, cerca de 1.000 lenguas habladas en África,
alrededor de 750 en Papúa-Nueva Guinea, más de 150 en la India, cerca de 100 en
Rusia y varias docenas en China y otros países.
Desde el punto de vista estadístico,
resulta sorprendente comprobar que más del 95% de la población mundial habla
apenas 260 lenguas. Una única lengua, el chino mandarín (o putonghua), es hablada por el 20% del
total. Si a ella se suman el inglés, el español, el ruso y el hindí, la proporción sube hasta el 45%.
Con la posterior inclusión del alemán, el japonés, el árabe, el bengalí, el portugués, el francés y el italiano se alcanza el 60%. Hay sólo doce lenguas en el
mundo que superan los cien millones de hablantes: chino mandarín, inglés, español, hindí, bengalí,
árabe, portugués, ruso, urdú, japonés, penyabí, alemán. En conjunto,
estas “macrolenguas” representan el idioma de la mitad de la población mundial
y son entendidas por las tres cuartas partes. Otras cincuenta lenguas —de entre
diez y cien millones de hablantes— representan el medio de comunicación del 35%
de la población del mundo. Alrededor de doscientas lenguas —de entre uno y diez
millones de hablantes— son empleadas por el 10%, mientras que únicamente el 5%
restante habla algunas de las miles de lenguas que cuentan con menos de un
millón de hablantes.
Familias
lingüísticas y clasificación genético-tipológica
Es un hecho constatable el que unas
lenguas son más parecidas entre sí que otras. Esta intuición, conocida ya desde
los comienzos de la civilización europea, fue desarrollada y estudiada en
detalle por los lingüistas del siglo XIX, dentro de una corriente filológica
conocida como gramática histórica (o gramática
comparada). La hipótesis principal sobre la que se trabajaba
consistía en la idea de que, allí donde dos o más lenguas compartieran un
conjunto de rasgos gramaticales, éstos eran atribuibles a un antepasado común
del que todas descendían. De esta forma, se desarrolló un modelo de clasificación
genética de las lenguas del mundo basado en su agrupamiento dentro de
familias con rasgos comunes, dentro de las cuales había una variedad
lingüística originaria (la llamada “lengua madre”) de la que todas las demás
descendían, creándose de esta forma un complicado sistema de relaciones
genéticas de proximidad y distancia (de forma parecida a los árboles
genealógicos dentro de la especie humana).
A pesar del carácter intuitivo y
comprensible de este modelo taxonómico, en ciertos aspectos es particularmente
problemático. Una de las razones más obvias de esto es que la naturaleza de las
lenguas y la de las personas es radicalmente distinta: mientras que la vida de
los seres humanos puede ser delimitada en el espacio y en el tiempo, no ocurre
lo mismo con las entidades lingüísticas. En un estado primitivo, las lenguas
genéticamente relacionadas pertenecientes a una misma familia poseen las
suficientes similitudes como para ser asociadas sin problemas, ya que derivan
de una variedad lingüística común. No obstante, a lo largo de su evolución
histórica desarrollan características gramaticales específicas de cada una, con
lo que al cabo de los años las diferencias pueden llegar a ser tan grandes que
resulte casi imposible afirmar que proceden de una misma lengua, o incluso que
pertenezcan a una misma familia. Ante este problema, los lingüistas modernos se
dividen en dos tendencias principales a la hora de llevar a cabo una
clasificación de las lenguas: por una parte se hallan los “disgregadores”,
aquéllos que necesitan la más firme evidencia antes de agrupar varias lenguas
dentro de una misma familia genética y tienden a la separación; por otro lado,
los “aglutinadores” no tienen problemas para llevar a cabo este tipo de
agrupación con tal de que las lenguas cumplan unos criterios mínimos de
similitud gramatical.
Las clasificaciones estándar de las
lenguas del mundo se ha llevado a cabo sobre principios básicamente
aglutinantes, como forma de evitar la confusión y facilitar una imagen global
del mapa lingüístico (aunque sin llegar a la postura extrema de considerar que
todas las lenguas del mundo se hallan genéticamente relacionadas). La taxonomía
propuesta en este artículo desarrolla un esquema generalmente aceptado dentro
del campo de la lingüística moderna, basado en criterios de tipo genético
y tipológico, en la medida en que las lenguas se agrupan
fundamentalmente de acuerdo a su evolución histórica, pero también, en un nivel
inferior, se tiene en cuenta su tipología o parecido gramatical. Esta
clasificación intenta ser lo más completa posible, agrupando no sólo las
lenguas más importantes sino todas aquéllas conocidas (incluso las ya extintas).
Por otro lado, ha habido un importante esfuerzo de normalización y
estandarización lingüística para adaptar los nombres de estas lenguas a la
ortografía del español (siempre que sea posible o recomendable), dado
que su denominación habitual, en muchos casos, es la de la lengua originaria o
una adaptación al inglés.
Como una primera aproximación de
carácter altamente “aglutinante”, se puede agrupar las familias de lenguas en
torno a quince phyla o macro-troncos lingüísticos generales (el término phyla,
cuyo singular es phylum, es un préstamo del campo de la biología). Entre
corchetes se incluye el número aproximado de lenguas que abarcan estos phyla:
A) Indoeuropeo (o Indo-hitita) [150]. Engloba la mayor parte de
Europa, ciertas regiones del suroeste asiático y en general todos aquellos
territorios del mundo en los que los europeos introdujeron sus variedades
lingüísticas. Se estima que la mitad de la población mundial habla lenguas
indoeuropeas, presentes en los cinco continentes.
Algunas de las más importantes obras literarias de la humanidad se han escrito
en lenguas pertenecientes a este phylum (latín, griego, sánscrito).
B) Eurásico [60]. Formado básicamente por las familias
urálica y altaica, que se extienden por una amplia
región fronteriza entre los continentes europeo y asiático, junto con una serie
de lenguas habladas en el norte de Asia que en conjunto se engloban dentro de
la familia paleoasiática (aunque ésta no es una agrupación
estrictamente genética). El phylum eurásico es una especie de cajón de
sastre que comprende un grupo heterogéneo de familias lingüísticas, y no todos
los especialistas aceptan su existencia.
C) Paleocaucásico [40]. Tronco lingüístico en el que se engloba
la familia caucásica. Aunque tradicionalmente ha venido
hablándose del phylum iberocaucásico como un orden lingüístico en el que se
incluirían tanto las lenguas caucásicas como otras aisladas de Europa (euskera, ibero, etrusco), esta relación no ha sido
plenamente demostrada y es rechazada por la lingüística actual.
D) Dravídico [30]. Abarca una serie de lenguas del sur de
la India sin relación genética alguna con el grupo indoiranio de la familia indoeuropea. Es probable que en su momento este phylum
ocupara la mayor parte de India y llegara incluso hasta Irán.
E) Áustrico (o Austroasiático) [200]. Formado por las familias
munda, mon-jemer, daica, tai y miao-yao, habladas en el sureste asiático.
F) Sinotibetano [250]. Formado por una serie de lenguas
habladas en China y la región suroriental de Asia.
G) Austronésico [1.700]. Incluye las familias malayo-polinesia, taiwanesa y papúa, habladas en las islas del Pacífico
y el Índico. Se cree que su foco originario de expansión estuvo en Filipinas en
el año 3000 a.C., lugar desde el que se extendieron hasta Madagascar y
Micronesia alrededor del 1500 a.C. para establecerse en la Polinesia y Nueva
Zelanda entre el 200 y 800 d.C.
H) Australiano [150]. Constituido por las lenguas indígenas
de Australia y unas pocas islas de su costa. La mayor diversidad se encuentra
en el norte. Estas lenguas, ninguna de las cuales posee más de cinco mil
hablantes, se hallan en inminente peligro de extinción, por su propio devenir
histórico y por la política lingüística unificadora del gobierno australiano.
Antes de la llegada de los primeros colonizadores europeos existía un número
estimado de quinientas lenguas australianas, y se cree que al cabo de la actual
generación únicamente cincuenta sobrevivirán.
I) Aleutiano-esquimal [2]. Familia lingüística independiente hablada
en la región ártica que se extiende entre Groenlandia, Siberia oriental y norte
de América.
J) Afroasiático (Camito-semítico, Eritraico o Lisrámico) [300]. Localizado en la Península
Arábiga y mitad norte de África. Algunas de las lenguas que forman este grupo
se han hablado desde hace al menos cinco mil años y han producido los más
antiguos testimonios escritos de la humanidad.
K) Nilo-sahariano [190]. Se extiende por una amplia banda
heterogénea que atraviesa el ecuador de África. No todos los lingüistas aceptan
la existencia de este phylum, algunas de cuyas agrupaciones lingüísticas
se clasifican de forma aislada bajo distintas denominaciones (Nilótico, Chari-Nilo, Nilo-camítico, Macro-sudánico).
L) Negro-cordofano (o Níger-Congo) [1.100]. Se extiende por la mitad
sur de África, aunque se concentra fundamentalmente en la zona que se localiza
entre el Sáhara, Chad y el golfo de Guinea. La principal familia que forma este
phylum está integrada por las lenguas bantúes, que se expandieron por un amplio
territorio africano desde su foco originario, al sureste de Nigeria, hacia el
año 300 a.C.
M) Joisano [30]. Constituido por variantes habladas en el
extremo meridional de África. Con anterioridad a la expansión de los pueblos
bantúes, las lenguas joisanas probablemente ocupaban toda la mitad meridional
del continente. Su rasgo más distintivo es la presencia de una serie de sonidos
característicos conocidos como clicks, una especie de chasquidos con
carácter fonológico.
N) Amerindio [1.000]. Engloba todas las lenguas nativas de
América salvo las familias aleutiano-esquimal (en el extremo septentrional del continente) y
atabascana (Canadá y Estados Unidos). Se estima que
llegaron a hablarse en su momento hasta tres mil lenguas amerindias, aunque en
los próximos años apenas doscientas sobrevivirán. Este phylum se divide
en cuatro grandes grupos geográficos de clasificación: lenguas de América
del Norte, lenguas de México y Guatemala, lenguas de América
Central y lenguas de América del Sur.
O) Na-dené [30]. Compuesto por
la familia atabascana (hablada en territorios de Alaska y Canadá,
así como en Nuevo México, Colorado y Arizona) y tres lenguas independientes de
Alaska. El navajo, la lengua indígena de América del
Norte con mayor número de hablantes, pertenece a este phylum.
Por otra parte, existe una serie de
lenguas aisladas e independientes cuya filiación a alguno de los grupos
lingüísticos anteriores es poco segura o inexistente (véase más abajo la
clasificación completa de las lenguas del mundo).
Además de las anteriores variantes
lingüísticas que podríamos denominar naturales o “puras”, hay que hacer mención
a una serie de lenguas “mixtas” conocidas como sabires y criollos.
Los sabires son lenguas auxiliares o secundarias que
surgen del contacto entre dos o más idiomas distintos (normalmente una lengua
indoeuropea y otra indígena de América, Asia, África u Oceanía) y que sirven
para establecer una primera comunicación básica entre personas que no poseen un
habla común en situaciones muy específicas. Su origen se remonta a los primeros
contactos entre los colonos europeos y los habitantes nativos de los
territorios que ocuparon, con los que se hizo necesaria una primera toma de
contacto que facilitara el comercio entre ambas partes. En el ámbito hispánico,
las lenguas sabires reciben su denominación de la primera variante lingüística
de intercambio, basada en el español, que se empleó con las colonias
mediterráneas. Dentro de la tradición anglosajona se conocen como lenguas pidgin, por motivos similares de comercio
en la región asiática del Pacífico (de hecho, pidgin fue una deformación
local de la palabra inglesa business).
Un sabir se caracteriza por poseer una gramática básica
y un vocabulario extremadamente reducido (generalmente entre 700 y 1.500
palabras), compuesto fundamentalmente por términos del inglés, el francés, el español o el portugués a los que se han añadido algunas palabras
indígenas. En algunos casos, no obstante, se trata meramente de una forma
simplificada de una lengua local (a menudo con préstamos de otra). Los sabires
no poseen hablantes nativos, puesto que por su misma naturaleza se trata
siempre de variantes lingüísticas utilizadas además de la lengua materna de
cada uno.
Los criollos son antiguos sabires que, tras un cierto
período de coexistencia, han dejado de ser meras formas de comunicación
auxiliares para convertirse en lenguas maternas de un grupo de hablantes (en un
proceso conocido como criollización). Como tales, las variantes criollas
han ampliado su vocabulario con respecto a los sabires para adaptarlo a las
necesidades diarias de sus hablantes. Las lenguas criollas no suelen
representarse gráficamente mediante la escritura, aunque por lo demás poseen
las mismas características formales que las lenguas naturales. Tras un
posterior estado evolutivo, el desarrollo social y educativo puede hacer que
una lengua criolla se relacione más estrechamente con el idioma europeo del que
adopta su vocabulario básico. En esta situación, la primera puede tender a
aproximarse progresivamente a la lengua estándar, lo que da lugar al llamado continuo
post-criollo, formado por una escala de variedades de habla que van desde
la forma criolla original (basilecto), pasando por una etapa intermedia
(mesolecto), hasta llegar a una variante que puede considerarse casi
como un dialecto de la lengua europea. Un claro ejemplo de continuo
post-criollo lo representa el inglés jamaicano.
Aparte de los sabires y criollos que se enumeran en la clasificación de las
lenguas del mundo (véase más abajo), hay un grupo de ellos, minoritarios o ya
desaparecidos, que merecen mencionarse:
delaware: sabir basado en el unami, lengua amerindia de la familia
algonquina. Se habló probablemente en época
precolombina en Delaware, Pennsylvania y Nueva York.
halbdeutsch: criollo que sirvió como lengua de
contacto entre los habitantes de la costa báltica y los germanos que
conquistaron esta región a finales de la Edad Media.
lingua franca (o propiamente sabir): sabir basado en el español y el provenzal que se habló en el Mediterráneo desde la época
de las Cruzadas hasta finales del siglo XIX.
língua geral: criollo derivado del tupí que se empleó como lengua de intercambio
comercial y cultural en Brasil entre los siglos XVI y XVIII.
tshinuk wawa: antiguo sabir basado en el chinook (o chinuco), lengua amerindia de la familia
penutia hablada en Oregón.
zurikoa (souriquois): sabir basado en el euskera usado entre los siglos XVI y XVII desde la
costa de Nueva Inglaterra hasta Islandia. Su existencia se debe a la presencia
de balleneros y pescadores vascos, que fueron los primeros en explotar esta
zona marítima.
El hombre siempre ha soñado con crear
una sola forma de comunicación lingüística que pudiera ser utilizada por todos
los hablantes del mundo y acabara de esta forma con la maldición de la “Torre
de Babel”. El proceso de homogeneización lingüística que se extendió por todo
el mundo a partir del siglo XVI, con la creación de los modernos estados, se
aceleró a finales del siglo XIX con la industrialización y el progreso
científico. La diversidad lingüística se consideró entonces un obstáculo para
la difusión del saber, y el monolingüismo se convirtió en un ideal. Surgió
entonces la idea de una “lengua universal” (se pensó incluso en volver al latín), lo que dio lugar a una
proliferación de lenguas artificiales. El término lengua artificial se
refiere a este tipo de variante lingüística que, por oposición al resto de
lenguas naturales, ha sido inventada para poder ser utilizada como medio de
comunicación universal. Entre sus precursores se hallan los españoles Ramón Llull (1233-1315) y Pedro Bermudo (siglo
XVII).
No obstante, el primer intento serio
de creación de una lengua artificial lo constituye el volapük, que J. M. Schleyer introdujo en
1880 utilizando diversos elementos de las lenguas modernas (básicamente de raíz
germánica). Debido a que se trataba de una variante difícil de aprender, en
1887 el oculista polaco L. L. Zamenhof creó el esperanto (literalmente ‘el que espera’),
caracterizado por una gramática más simplificada y un vocabulario de
construcción lógica. El esperanto ilusionó enormemente a la comunidad
científica, que por primera vez creyó haber encontrado una lengua universal, y
ello se tradujo en un incremento en su número de hablantes y el desarrollo de
una amplia producción literaria (de hecho, muchas de las obras maestras de la
literatura universal han sido traducidas al esperanto). Posteriores intentos
por mejorar o reformar esta lengua resultaron infructuosos, por lo que hoy en
día el esperanto conserva básicamente la forma original que propuso Zamenhof.
Ya en el siglo XX surgieron otras dos lenguas artificiales, occidental e interlingua (de base románica), aunque más restringidas a
un ámbito científico y técnico. Otros intentos de carácter más minoritario han
sido el ido, el novial, el gloro y el iala.
La principal ventaja que poseen las
lenguas artificiales con respecto a las naturales radica en su simplicidad y en
la ausencia de formas irregulares en su sistema gramatical. Sin embargo, sus
más notables desventajas son la ausencia de hablantes nativos y la falta de
prestigio como medio de comunicación en los distintos países, lo que las ha
condenado al ostracismo durante los últimos años. Hoy en día, la amplia
difusión del inglés por todo el mundo hace pensar que es este
idioma, más que ninguna otra lengua artificial, el candidato número uno para
convertirse en un futuro próximo en la ansiada forma de comunicación universal.
Un tipo especial de lenguas son los
lenguajes de signos, creaciones relativamente recientes —se remontan a los
siglos XVIII y XIX— destinadas al aprendizaje de los sordos. La característica
principal de estas formas de comunicación es la ausencia de sonidos y su falta
de correspondencia con las lenguas habladas (por ejemplo, el lenguaje de signos
americano resulta ininteligible para los usuarios del lenguaje de signos británico).
Clasificación
de las lenguas del mundo
Dentro de la siguiente clasificación
genético-tipológica, la unidad superior corresponde a los phyla o macro-troncos
lingüísticos. En un nivel inferior se desarrolla un esquema taxonómico con
la siguiente ordenación jerárquica: tronco
→ familia → grupo → rama → división → lengua →
dialecto. No obstante, este esquema no se aplica sistemáticamente en
todos los casos, puesto que depende de la mayor o menor complejidad de cada
agrupación lingüística, y en ocasiones puede ser recursivo. También hay que
tener presente que, a medida que se asciende jerárquicamente en esta
clasificación, las relaciones son más genéricas y tienden a establecerse en
función de criterios puramente geográficos más que lingüísticos (como es el
caso de los distintos troncos).
Por claridad expositiva, los grupos
lingüísticos más generales se indican con distinto color: familias en azul y grupos
en rojo. Por regla general, las distintas agrupaciones lingüísticas se
representan en negrita o en cursiva, para diferenciarlas de las lenguas y
dialectos, que son los nodos terminales de la clasificación y se escriben en
letra redonda. Una cruz [†] significa que la lengua o el dialecto en cuestión
es una variante lingüística extinta en la actualidad. Por otro lado, dentro de
los artículos correspondientes a cada familia y grupo lingüístico se reproduce
el correspondiente esquema clasificatorio y se incluyen entre paréntesis los
territorios en los que se hablan las distintas lenguas.
En el caso de las lenguas menos
conocidas, he intentado respetar su nombre y ortografía original siempre y
cuando no exista un término más habitual en español.
PHYLUM INDOEUROPEO
♦ Familia indoeuropea
• Grupo germánico
1. Rama septentrional
1.1. Escandinavo
oriental
1.1.1.
Danés
1.1.2.
Sueco
1.2. Escandinavo
occidental
1.2.1.
Noruego
1.2.2.
Islandés
1.2.3.
Feroés
2. Rama occidental
2.1. Subgrupo
anglofrisón
2.1.1. Inglés
2.1.2.
Frisón
2.2. Subgrupo
germánico
2.2.1. Alto
alemán
2.2.1.1. Alemán
2.2.1.2. Luxemburgués
2.2.1.3. Judeoalemán
2.2.2. Bajo
alemán
2.2.2.1.
Neerlandés
2.2.2.1.1. Holandés
2.2.2.1.2. Flamenco
2.2.2.2. Afrikaans
3. Rama oriental
3.1. Gótico
[†]
3.2.
Burgundio [†]
3.3.
Vándalo [†]
3.4. Gépido
[†]
• Grupo itálico
1. Rama osco-umbra
1.1. Osco [†]
1.2.
Sabélico [†]
1.3. Umbro
[†]
2. Rama latino-falisca
2.1. Latín
[†]
2.2.
Falisco [†]
• Grupo románico (lenguas
derivadas del latín)
1. Rama oriental
1.1. Rumano
1.1.1.
Dacorrumano
1.1.2.
Macedorrumano
1.1.3.
Meglenorrumano
1.1.4.
Istriorrumano
1.1.5.
Moldavo
2. Rama occidental
2.1. Subgrupo
italorrománico
2.1.1.
Italiano
2.1.2.
Sardo
2.1.3.
Istriorrománico
2.1.4.
Dálmata [†]
2.2. Subgrupo
galorrománico
2.2.1.
Francés
2.2.2.
Provenzal
2.2.3.
Retorrománico
2.2.3.1. Romanche
2.2.3.2. Friulano
2.2.3.3. Ladino
2.3. Subgrupo
iberorrománico
2.3.1.
Español
2.3.2. División
galaicoportuguesa
2.3.2.1. Portugués
2.3.2.2. Gallego
2.3.3.
Catalán
2.3.3.1. Catalán estándar
2.3.3.2. Valenciano
2.3.3.3. Balear
2.3.4.
Mozárabe [†]
• Grupo celta
1. Rama insular
1.1. Subgrupo gaélico (o goidélico)
1.1.1. Irlandés
1.1.2.
Gaélico escocés
1.1.3.
Manés [†]
1.2. Subgrupo britónico
1.2.1. Galés
1.2.2. Bretón
1.2.3. Córnico [†]
2. Rama continental
2.1. Galo [†]
• Grupo helénico
1. Rama ática
1.1. Griego
1.2.
Póntico
2. Rama dórica
2.1.
Chaconio
• Grupo eslavo
1. Rama occidental
1.1. Subgrupo
lequítico
1.1.1.
Polaco
1.1.2.
Casubio
1.1.3.
Eslovincio [†]
1.1.4.
Polabo [†]
1.2. Subgrupo
lusaciano
1.2.1.
Sorbio
1.3. Subgrupo
checoslovaco
1.3.1.
Checo
1.3.2.
Eslovaco
2. Rama oriental
2.1. Ruso
2.2.
Bielorruso
2.3.
Ucraniano
3. Rama meridional
3.1. Eslavo
oriental
3.1.1.
Búlgaro
3.1.2.
Macedonio
3.1.3.
Eslavo antiguo [†]
3.2. Eslavo
occidental
3.2.1.
Serbocroata
3.2.2.
Esloveno
• Grupo báltico
1. Lituano
2. Letón
3. Prusiano antiguo [†]
• Grupo indoiranio
1. Rama indoaria
1.1.
Sáncrito [†]
1.2.
Prácrito [†]
1.3. Región
central
1.3.1.
Bilí
1.3.2.
Guyaratí
1.3.3.
Jandesí
1.3.4.
Penyabí
1.3.5.
Rayastaní
1.3.6.
Marvarí
1.3.7. Subgrupo
indostaní
1.3.7.1. Hindí
1.3.7.2. Urdú
1.3.8.
Romaní
1.4. Región
oriental
1.4.1.
Bengalí
1.4.2.
Asamés
1.4.3.
Biharí
1.4.4.
Oriya
1.5. Región
septentrional
1.5.1.
Nepalí
1.5.2.
Paharí
1.6. Región
noroccidental
1.6.1.
Dárdico
1.6.1.1. Subgrupo occidental
1.6.1.1.1. Nuristaní
1.6.1.1.2. Damelí
1.6.1.2. Subgrupo central
1.6.1.2.1. Jovaro
1.6.1.2.2. Calasa
1.6.1.2.3. Pachái
1.6.1.2.4. Votapurí
1.6.1.2.5. Sumastí
1.6.1.2.6. Gavarbatí
1.6.1.2.7. Tirají
1.6.1.2.8. Citralí
1.6.1.3. Subgrupo oriental
1.6.1.3.1. Cachemir
1.6.1.3.2. Bascarí
1.6.1.3.3. Garví
1.6.1.3.4. Torvalí
1.6.1.3.5. Maiyá
1.6.1.3.6. Sina
1.6.1.3.7. Dumaquí
1.6.1.3.8. Palura
1.6.2.
Landa
1.6.3.
Sindí
1.7. Región
meridional
1.7.1.
Maratí
1.8. Región
insular
1.8.1.
Cingalés
1.8.2.
Maldivo
1.8.3.
Veda
2. Rama irania
2.1. Región
suroccidental
2.1.1.
Persa
2.1.1.1. Farsi
2.1.1.2. Dari
2.1.1.3. Tayiquí
2.1.2.
Bajtiarí
2.1.3.
Lurí
2.1.4.
Dialectos fars
2.1.5.
Cumsarí
2.1.6.
Tatí
2.2. Región
noroccidental
2.2.1.
Curdo
2.2.2.
Sasa
2.2.3.
Guraní
2.2.4.
Talechí
2.2.5.
Vafsí
2.2.6.
Astiyaní
2.2.7.
Dialectos centrales de Irán
2.2.8.
Dialectos tat
2.2.9.
Guilaquí
2.2.10.
Masandaraní
2.2.11.
Bascardí
2.2.12.
Semnaní
2.2.13. Baluchí
2.2.14.
Parachí
2.2.15.
Ormurí
2.2.16.
Medo [†]
2.2.17.
Parto [†]
2.3. Región
suroriental
2.3.1.
Pasto
2.3.2.
Munyí
2.3.3.
Yidga
2.3.4. Lenguas
pamires
2.3.4.1. Vají
2.3.4.2. Chugní
2.3.4.3. Yasgulamí
2.3.4.4. Saricolí
2.3.4.5. Sanglechí
2.3.4.6. Iscasmí
2.3.4.7. Sebaquí
2.3.4.8. Rochaní
2.3.4.9. Bartanguí
2.3.4.10. Orochorí
2.3.5.
Avéstico [†]
2.3.6.
Saka [†]
2.3.7.
Bactriano [†]
2.4. Región
nororiental
2.4.1.
Osete
2.4.2.
Yagnobí
2.4.3.
Escita [†]
2.4.4.
Sármata [†]
2.4.5.
Sogdiano [†]
2.4.6.
Juaresmiano [†]
• Grupo anatolio
1. Hitita [†]
2. Lidio [†]
3. Luvita [†]
4. Palaico [†]
5. Licio [†]
•
Lenguas independientes
1. Albanés
2. Armenio
3. Tocario [†]
PHYLUM EURÁSICO
PHYLUM PALEOCAUCÁSICO
PHYLUM DRAVÍDICO
PHYLUM ÁUSTRICO
PHYLUM SINOTIBETANO
PHYLUM AUSTRONÉSICO
PHYLUM AUSTRALIANO
PHYLUM AFROASIÁTICO
PHYLUM NILO-SAHARIANO
PHYLUM NEGRO-CORDOFANO
PHYLUM JOISANO
PHYLUM AMERINDIO
PHYLUM NA-DENÉ
Distribución
geográfica de las lenguas del mundo
Otra posible taxonomía, de carácter más
territorial que genético, es la que reparte las anteriores familias
lingüísticas entre los cinco continentes. La utilidad de este esquema radica en
un acceso más sencillo e intuitivo a las distintas lenguas individuales que se
hablan en la actualidad, a partir de un esquema clasificatorio más familiar
para los no lingüistas. Como puede verse a continuación, la división
lingüística y la geográfica no siempre coinciden, puesto que es frecuente el
caso de lenguas que se extienden por territorios alejados (incluso
pertenecientes a diferentes continentes) entre los que no parece haber ningún
nexo. La principal causa de esto hay que buscarla en los movimientos
migratorios que a lo largo de la historia han llevado las lenguas desde su
lugar de origen hasta regiones distantes, con los consiguientes procesos de
desgaste, cambio y desaparición. Por esta razón se tiene en cuenta únicamente
las variantes lingüísticas originarias de cada territorio, sin considerar las
distintas lenguas, en su mayoría europeas, que fueron posteriormente
implantadas (tal es el caso, por ejemplo, del inglés, el español, el francés y el portugués en el continente americano).
Europa
La amplia mayoría de las lenguas que
se hablan en el continente europeo (entendido, en el sentido más cultural y
geográfico del término, como el extenso territorio al oeste de los Montes
Urales y al norte del Tauro Armenio) pertenecen a las familias indoeuropea,
urálica, altaica y caucásica. De entre las
pocas lenguas que no figuran en estos grupos lingüísticos destacan por su
importancia el euskera (lengua independiente) y el maltés (lengua
semítica de la familia afroasiática). En Groenlandia se habla el groenlandés,
que es un dialecto del esquimal (lengua perteneciente a la familia
aleutiano-esquimal).
Asia
El continente asiático está
representado por las lenguas pertenecientes a las familias indoeuropea y
altaica que no se hablan en Europa (grupos indoiranio, mongólico y tungúsico),
además de las familias paleoasiática, dravídica, munda, mon-jemer, daica, tai, miao-yao,
sinotibetana, vietnamuón y taiwanesa. Por otro lado, también incluye las
lenguas semíticas de la familia afroasiática que se hablan en la Península
Arábiga (árabe meridional, hebreo, siríaco y asirio), así como las
pertenecientes a la familia malayo-polinesia que se hablan en Malasia,
Indonesia y Filipinas (malayo, indonesio, javanés, sundanés, madurés,
minancabáu, achenés, toba, buguinés, balinés, tagalo, cebuano, hiligainón,
ilocano, bicolo, samarón, capampango y pangasino, entre otras). También se
hablan en el continente asiático las siguientes lenguas individuales de
importancia: coreano, ainú, japonés, riuquivano, nahalí y buruchasquí.
En Siberia se emplea el esquimal, que pertenece a la familia aleutiano-esquimal.
Oceanía
En este continente se hablan las
lenguas de la familias malayo-polinesia (salvo las anteriormente mencionadas
que se hablan en Asia), papúa y australiana.
África
Engloba las familias lingüísticas
negro-africana, cordofana, macro-sudánica, sahariana, mabana, comana y joisana,
así como la mayoría de las lenguas de la familia afroasiática (salvo el árabe meridional, el hebreo, el siríaco y el asirio, que se
hablan en Asia). Dos casos excepcionales son el malgache y el afrikaans: el
primero es uno de los idiomas oficiales de Madagascar, aunque lingüísticamente
pertenece a la familia malayo-polinesia (más en concreto, se cree que está
emparentado con el grupo de lenguas que se hablan en Indonesia). Por otro lado,
se puede considerar que el afrikaans (lengua indoeuropea del grupo germánico)
es una variante originaria de África, ya que, a pesar de derivar genéticamente
del neerlandés que los colonos holandeses introdujeron en Sudáfrica, ha
absorbido tantos elementos indígenas con el paso del tiempo que se ha
convertido en una lengua básicamente distinta a la europea. Por lo que respecta
a las variantes lingüísticas independientes, las más importantes son songái,
cherma y fora.
América
La mayoría de las lenguas indígenas
del continente americano se agrupan en familias lingüísticas dispersas que en
conjunto se engloban dentro del tronco amerindio, mientras que un pequeño grupo
de lenguas habladas en la región más septentrional, pertenecientes al tronco
na-dené, no presentan relación alguna con las anteriores (véase la
clasificación genética anterior). En Alaska y en Canadá se habla el esquimal,
mientras que en el territorio estadounidense de las Islas Aleutianas se emplea
el aleuta; ambas lenguas se engloban dentro de la familia aleutiano-esquimal.
Las
cien principales lenguas del mundo
A continuación se presenta una lista
(actualizada a fecha de 1997) de las 100 lenguas del mundo más habladas,
organizadas según su número estimado de hablantes. A la hora de llevar a cabo esta
ordenación se han tenido en cuenta criterios puramente estadísticos, aunque
conviene hacer dos puntualizaciones: 1) se incluyen únicamente aquellas
variedades lingüísticas que representan lenguas en el sentido estricto de la
palabra, no dialectos (en el caso del "chino" no cabe hablar de distintas
variedades locales, ya que resultan mutuamente incomprensibles en su forma
hablada y sólo el chino mandarín o putonghua 'lengua común' es el idioma
oficial de China); 2) el número estimado de hablantes hace referencia a
aquéllos que utilizan el idioma en cuestión como primera lengua —lo que se
entiende por lengua materna—, no a los potenciales hablantes o
conocedores de la misma (lo cual incrementaría considerablemente las cifras de
alguna, como por ejemplo el inglés y el francés, idiomas con representación
importante en los cinco continentes y usadas como segunda lengua en muchas
situaciones). Como puede verse, siete variedades incluidas en las top ten
pertenecen a la familia indoeuropea, pues no en vano sus hablantes
representan más de la mitad de la población mundial.
1. chino mandarín
885.000.000
2. inglés 440.000.000
3. español 377.000.000
4. hindí 295.000.000
5. bengalí 190.000.000
6. árabe 180.000.000
7. portugués 175.000.000
8. ruso 150.000.000
9. urdú 140.000.000
10. japonés 126.000.000
11. penyabí 113.000.000
12. alemán 105.000.000
13. chino vuyú
77.175.000
14. javanés 75.500.800
15. francés 74.000.000
16. coreano 72.000.000
17. telegú 69.000.000
18. maratí 65.000.000
19. chino cantonés
64.000.000
20. italiano 61.000.000
21. tamil 59.000.000
22. vietnamita 59.000.000
23. turco 56.000.000
24. persa 55.000.000
25. chino min
49.000.000
26. biharí 48.700.000
27. ucraniano 48.700.000
28. tai 48.500.000
29. guyaratí 45.000.000
30. polaco 43.000.000
31. chino hunanés
36.015.000
32. malabar 34.000.000
33. canarés 33.000.000
34. chino quejiá
32.000.000
35. oriya 30.000.000
36. uzbeco 29.053.000
37. pasto 24.250.000
38. rumano 22.500.000
39. neerlandés 22.300.000
40. birmano 22.000.000
41. hausa 22.000.000
42. acerí 20.650.000
43. chino ganyú
20.580.000
44. yoruba 20.000.000
45. landa 20.000.000
46. serbocroata 18.500.000
47. malayo 17.526.000
48. sindí 17.500.000
49. nepalí 17.000.000
50. indonesio 17.000.000
51. amárico 15.000.000
52. rayastaní 15.000.000
53. asamés 15.000.000
54. húngaro 14.500.000
55. cingalés 14.000.000
56. chuan 14.000.000
57. ibo 12.200.000
58. griego 12.000.000
59. checo 12.000.000
60. cebuano 12.000.000
61. catalán 11.040.000
62. tagalo 10.500.000
63. curdo 10.000.000
64. sueco 9.250.000
65. bielorruso 8.890.000
66. zulú 8.780.000
67. jemer 8.063.200
68. ilocano 8.000.000
69. cazajo 8.000.000
70. ruanda 8.000.000
71. afrikaans 7.880.000
72. búlgaro 7.800.000
73. uiguro 7.464.000
74. marvarí 7.112.000
75. acano 7.000.000
76. chona 7.000.000
77. somalí 7.000.000
78. tártaro 7.000.000
79. josa 6.500.000
80. luba 6.300.000
81. criollo francés 6.065.000
82. finés 6.000.000
83. romaní 6.000.000
84. rundí 6.000.000
85. eslovaco 5.600.000
86. danés 5.370.000
87. quicuyú 5.347.000
88. santalí 5.320.000
89. macua 5.208.000
90. suahelí 5.000.000
91. bilí 5.000.000
92. albanés 5.000.000
93. moré 4.700.000
94. baluchí 4.200.000
95. noruego 4.180.000
96. armenio 4.000.000
97. bambara 4.000.000
98. georgiano 4.000.000
99. guaraní 4.000.000
100. tigriña 4.000.000
CAMPBELL, George L.: Compendium
of the World's Languages [2 vols.] (London:
Routledge, 1991).
CANELLADA,
M. J. / KUHLMANN, J.: Pronunciación del español (Madrid: Castalia,
1987).
COMRIE, Bernard (ed.): The
World’s Major Languages (Oxford University Press, 1990).
CRYSTAL, David: The
Cambridge Encyclopedia of Language (Cambridge University Press, 1987).
CRYSTAL,
David: Patología del lenguaje (Madrid: Cátedra, 1983).
The Germanic Languages (London:
Routledge, 1994).
GIL
FERNÁNDEZ, Juana: Los sonidos del lenguaje (Madrid: Síntesis, 1988).
GRIMES, Barbara F. (ed.): Ethnologue:
Languages of the World (Dallas: Summer Institute of Linguistics, 1996).
HAUGEN, Einar: Scandinavian
Language Structures. A Comparative Historical Survey (University of
Minnesota Press, 1982).
KATZNER, Kenneth: The
Languages of the World (London: Routledge, 1995).
LADEFOGED, Peter: A Course
in Phonetics (New York: Harcourt, Brace & Jovanovich, 1975).
MORENO
CABRERA, Juan Carlos: Lenguas del mundo (Madrid: Visor, 1990).
NAVARRO
TOMÁS, Tomás: Manual de pronunciación española (Madrid: CSIC, 1971).
http://www.arts.gla.ac.uk ; The International
Phonetic Association website.
|
|
|
©
www.linguasport.com
Página
creada, diseñada y editada por Santiago Velasco
|