O que é uma palavra?

Thiago Nascimento de Melo (PPGLIN/UFRJ)

Fonte: Unsplash

Resumo: Para bom entendedor, meia palavra basta. Será mesmo? Apesar de nossa intuição muito firme sobre o que é uma palavra, discutimos neste texto sobre as dificuldades de uma conceituação técnica apropriada. Para isso, abordamos diferentes critérios de identificação, que levam em conta a língua escrita, e também aspectos de ordens formal e fonológica. Por fim, apresentamos um debate mais recente que coloca em pauta os processos envolvidos na formação de uma palavra. Nessa discussão, apresentamos alguns dados de expressões idiomáticas e exploramos línguas sintéticas.

Philosophiae naturalis principia mathematica é o título da mais importante obra de Isaac Newton, em que são apresentados conceitos fundamentais da Mecânica Clássica. Eu te pergunto: quantas são as palavras do título dessa obra? Tenho certeza de que, mesmo que você não entenda latim, há certo nível de conforto e certeza ao responder essa pergunta – São quatro! Afinal, a noção de palavra nos parece bastante evidente e intuitiva. Mas você já refletiu mais a fundo sobre esse conceito? A partir de agora, te convido para essa reflexão.

No dicionário Oxford Languages, uma das definições de palavra é “unidade da língua escrita, situada entre dois espaços em branco, ou entre espaço em branco e sinal de pontuação”. Não tenho dúvidas de que, para responder à pergunta que iniciou este artigo, você utilizou esse artifício visual: uma palavra é um conjunto de letras separadas por um espaço em branco. No entanto, é muito evidente que essa definição se situa no domínio de um sistema de escrita com suas próprias convenções. Observe abaixo o Papiro 46, um manuscrito grego do Novo Testamento paleograficamente datado entre 175 e 225:

Fonte: Wikipédia

Não parece tão simples identificar as palavras desse texto. Isso ocorre porque, no grego e no latim antigos, as palavras não eram separadas no texto escrito como são modernamente – muito por causa da necessidade prática de se economizar espaço, uma vez que a produção de um texto escrito (num papiro, por exemplo) tinha custos elevados. No mesmo espírito, veja trecho de um romance japonês publicado em 1908:

Fonte: Wikipédia

Para aqueles que não entendem japonês, é muito difícil identificar as palavras nesse texto escrito. No português e na maioria das línguas europeias, o sistema de escrita adota uma base fonológica, na qual as letras (ou, tecnicamente, os grafemas) buscam referenciar fonemas, uma abstração dos sons da língua. Por outro lado, o japonês emprega um sistema escrito em que são utilizados ideogramas, símbolos gráficos que representam as palavras pelo conceito que transmitem. Por exemplo, veja como os conceitos de árvore, bosque e floresta são representados, respectivamente:

Fonte: Blog The Rising Sky

Veja que noções como coletividade, pluralidade e grandeza de bosque e floresta são atingidas pela adição de signos que representam o conceito de árvore.

Até aqui, meu objetivo é mostrar que utilizar as convenções de escrita para definir a noção de palavra não é o melhor caminho, o que fica ainda mais evidente quando consideramos que os estudos linguísticos mostram que a maioria das línguas que são ou já foram faladas por humanos ao longo de toda a história não têm sistema de escrita. Isso porque a escrita é tecnologia. Uma invenção. Uma convenção, cujo domínio depende de instrução formal (como acontece nas escolas, por exemplo). Por outro lado, nas palavras de Noam Chomsky, em On nature and language, “a linguagem é objeto natural, componente da mente humana fisicamente representado no cérebro e parte da dotação biológica da espécie”. Qualquer ser humano com plenas capacidades mentais e inserido em uma comunidade consegue naturalmente adquirir e usar uma língua, independentemente da disponibilidade de um sistema escrito.

Nesse sentido, acredito que ninguém pensaria que uma língua que não conte com escrita não tenha palavras. Precisamos, portanto, pensar em uma outra definição para entender verdadeiramente o que é uma palavra, enquanto um conceito da linguagem. Proponho duas possibilidades: analogamente ao que fazem os sistemas escritos do japonês e do português, podemos considerar o conceito e a forma das palavras.

Esse é justamente o percurso adotado por Mattoso Câmara Jr. O importante linguista brasileiro do século XX explora os conceitos de vocábulo formal e vocábulo fonológico1. O vocábulo formal considera a estrutura morfológica da língua, de modo que se estabelece, em linhas gerais, em torno de uma raiz (aquele pedaço da palavra que carrega seu significado elementar). Por exemplo, em casa, há um vocábulo morfológico, com a presença da raiz cas e da vogal temática a. Essa mesma raiz pode ser unida a outros morfemas para formar outros vocábulos formais, como casinha, casebre ou casarão. Já o vocábulo fonológico é estabelecido pela segmentação na cadeia de sons emitidos na fala. Na língua portuguesa, essa segmentação ocorre em torno do acento da palavra, ou seja, da sílaba mais proeminente (que é chamada na escola de sílaba tônica). Em casa, nós temos igualmente apenas uma palavra fonológica, sendo ca a sílaba tônica (mais forte) e sa a sílaba átona (mais fraca).

Contudo, nem sempre há um isomorfismo (ou seja, uma relação um para um) entre vocábulos formais e fonológicos. Na sequência me vacinei, temos dois vocábulos formais: o pronome me e o verbo vacinei. Porém, esse pronome tem apenas uma sílaba átona, fonologicamente mais fraca. Essa ‘fraqueza’ pode ser observada pela realização do fonema /e/ como um [ɪ] (ou seja, aquilo que seria um som de i, mas um pouco mais relaxado). Falamos (ou, pelo menos, podemos falar) mi vacinei, em vez de mê vacinei. Perceba como essa conversão não pode ser realizada em contextos com um e tônico, como em não seja um bêbado – pronunciando como não sêja um bêbado, e como não não sija um bíbado.

Até aqui, vimos motivações de ordem fonético-fonológica para mostrar que me vacinei formam apenas um vocábulo fonológico; ou seja, juntando as duas palavras, temos somente uma sílaba tônica. Agora, podemos observar também repercussões sintáticas desse fato. Esse pronome átono também é chamado de clítico, precisando estar junto de uma outra palavra que conte com uma sílaba tônica. Isso fica evidente, por exemplo, pela impossibilidade de usarmos me autonomamente em uma sentença. Se alguém te faz uma pergunta como “O médico vacinou quem?”, você jamais poderia responder “Me!”, concorda? Pelo contrário, você precisa transmitir as informações de primeira pessoa do singular utilizando um pronome tônico: eu (pronunciado como êu, mas nunca iu).

Interessantemente, não é incomum que crianças, enquanto se alfabetizam, cometam erros relacionados à escrita dos clíticos. Quanto à associação entre letra e som, muitas vezes utilizam a letra i quando as convenções de escrita exigem a letra e, produzindo, por exemplo, mi vacinei. Quanto à separação de palavras na escrita, também é recorrente que juntem o clítico ao verbo que ele modifica, como em mevacinei/mivacinei. Ainda que as convenções da língua portuguesa separem totalmente o clítico quando ele está antes do verbo (o que chamamos de próclise), elas não o fazem quando o clítico vem depois (o que chamamos de ênclise). Neste caso, a relação mais íntima do clítico com o verbo é sinalizada com um hífen: vacinei-me. Assim, fica claro mais uma vez como a língua escrita é de fato uma convenção; outras decisões poderiam ser tomadas quanto à escrita desses elementos. Por exemplo, no espanhol, o clítico pode ser escrito junto ao verbo, sem nenhuma separação, em alguns contextos, como em vacunándome (vacinando-me).

Em me vacinei, portanto, o pronome me se associa ao verbo vacinei para formar um só vocábulo fonológico, ainda que tenhamos, como vimos, dois vocábulos formais. Reconhecer essa propriedade (e os fatos linguísticos a ela associados) é uma ferramenta importante para o professor de português, tanto no ensino da escrita quanto no reconhecimento das estruturas da língua. Mais que isso, essa diferença entre vocábulo formal e fonológico pode, inclusive, ser utilizada artisticamente (no uso da língua de fato). Vejamos um trecho da música Cálice, de Chico Buarque:

“Pai, afasta de mim esse cálice

De vinho tinto de sangue”

Na luta contra censura da Ditadura Militar no Brasil, Chico Buarque queria afastar de si o cale-se. Nesse caso, temos um verbo e um clítico, que constituem um vocábulo fonológico e dois vocábulos formais. Na escrita da música, contudo, o autor escreve cálice, que possui exatamente a mesma pronúncia de cale-se. Agora, contudo, esse único vocábulo fonológico representa, também, um único vocábulo formal. Como os militares censores não eram particularmente inteligentes, não perceberam esse jogo de palavras e acabaram liberando a canção.

Perceba que, mesmo do ponto de vista científico, o entendimento do que é uma palavra enfrenta muitos desafios. Dependendo do critério adotado, termos vistos como uma palavra podem ser considerados mais de uma palavra, e vice-versa. Ainda assim, os estudos linguísticos tradicionais atribuíram um estatuto especial ao conceito de palavra. Muitas vezes sem saber definir o que é uma palavra, mas apenas sentir, teorias se desenvolveram2. Sob esse olhar, um modelo de arquitetura de gramática (ou seja, um modelo sobre o funcionamento do sistema gramatical) muito típico possui léxico e sintaxe enquanto módulos rigidamente separados. O primeiro é responsável por gerar palavras com suas próprias regras. O segundo é responsável por pegar palavras prontas, enquanto unidades, e organizá-las em uma sentença. Esse é basicamente o modelo de língua que aprendemos na escola. Há palavras e há frases. A partir de agora, veremos alguns problemas de um sistema assim.

Uma primeira questão está relacionada ao tipo de morfema que podemos adicionar nas palavras. Por exemplo, a partir da palavra feliz, podemos adicionar o prefixo in, gerando infeliz, ou o sufixo mente, gerando felizmente. Mais que isso, podemos fazer as duas coisas, gerando infelizmente. Esses afixos são chamados afixos derivacionais. Perceba como esses afixos podem trazer uma contribuição de significado (negação, no caso de in) e mudar a classe da palavra (de adjetivo para advérbio, no caso de mente). No sistema tradicional de que falamos, é bem razoável pensar que essas palavras todas (feliz, infeliz, felizmente e infelizmente) sejam geradas no léxico, com regras específicas para suas formações, e utilizadas na sintaxe para formar sentenças como O menino é infeliz ou Felizmente, estou entendendo tudo. Esse sistema, contudo, tem dificuldade para lidar com os morfemas flexionais, que dependem de informações presentes na sintaxe. Por exemplo, em As meninas jogam futebol, o verbo jogam está na forma plural, marcada pelo morfema flexional m (que também chamamos de desinência), em oposição à forma singular joga. Isso acontece porque o verbo concorda com o sujeito plural as meninas. A grande questão aqui é: como o léxico saberia que precisa colocar a desinência m se o motivo dessa colocação é uma informação (sujeito plural) presente somente no nível da sentença? Em outras palavras, o léxico, de onde a sintaxe tira as palavras, não tem como saber qual é o sujeito e, portanto, não tem como saber se gera/entrega a palavra joga ou a palavra jogam. Assim sendo, pelo menos alguma parte de algumas palavras deve ser formada pós-sintaticamente, e não no léxico.

Um outro problema desse modelo de gramática está relacionado a expressões idiomáticas. Como vimos, muitas vezes associamos a noção de palavra ao significado elementar que expressam. Porém, qual é o significado elementar de expressões como chutar o balde, encher linguiça e papar mosca?Essas estruturas tipicamente sintáticas veiculam sentidos muito parecidos com aqueles de palavras simples, como desistir, enrolar e bobear. Por isso, alguns linguistas defendem que essas sequências, assim como palavras, também devem ser formadas no léxico. O problema é que essas sequências contam com os morfemas flexionais de que falamos no parágrafo anterior, os quais dependem da sintaxe para serem expresso: Os meninos chutam o balde, Aquele palestrante enche linguiça e Os candidatos paparam mosca.

Problemas como esses levaram ao desenvolvimento de teorias mais modernas que rejeitam a arquitetura gramatical com léxico e sintaxe computacionais (ou seja, como os que vimos, que processam informações e geram elementos). A Morfologia Distribuída, que se estabeleceu na última década do século XX, tem defendido muito consistentemente que tanto vocábulos quanto sentenças são geradas pelo mesmo conjunto de regras computacionais sintáticas. Assim, a diferença entre os conceitos de palavra e frase é criticamente reduzida, e consideramos que o que se sabe sobre palavras é basicamente aquilo que sabemos sobre sentenças. A nossa intuição sobre o que são palavras, então, não seria sobre palavras de fato, mas sim sobre as raízes, de que falamos anteriormente. Reconhecemos casa, menino e cálice como palavras porque elas veiculam os significados de suas raízes. E, em línguas como o português e o inglês (esta em que muitas das teorias linguísticas se basearam), as palavras se assemelham formalmente às raízes. Esse, contudo, nem sempre é o caso.

As línguas sintéticas e polissintéticas juntam muitos morfemas em uma mesma palavra, que acaba conseguindo expressar todas as informações de uma sentença completa de línguas isolantes ou flexionais (como chinês ou português). Veja o seguinte exemplo do Karajá, retirado do livro A linguística no século XXI: convergências e divergências no estudo da linguagem, de Aniela Improta, Lilian Ferrari e Marcus Maia:

rarybèmyhyrenyõeri3

r a ry bè myhy reny õ reri

3pl vt             boca          água          cont               pl                   neg          pres.prog

‘Eles não estão falando.’

Perceba como todas as informações de Eles não estão falando são expressas em uma só palavra do Karajá, rarybèmyhyrenyõeri. Observe que, nesse caso, não se trata de uma convenção de escrita, em que palavras diferentes são escritas juntas. Na verdade, cada uma das partes da palavra é um morfema, uma unidade mínima de forma e sentido que deve ser prender a outras estruturalmente. No português, essa subdivisão das palavras pode ser observada na forma verbal cantam, em que há a raiz cant, a vogal temática a e a marca de terceira pessoa do plural (referente a eles) m. De mesmo modo, em rarybèmyhyrenyõeri, raiz, vogal temática e marca de número e pessoa se articulam a outros morfemas para formar uma única palavra.

Conhecer línguas como Karajá é surpreendente, e com certeza desafia nossos saberes sobre língua e linguagem. Assim, as perguntas continuam. O que é uma palavra? Consideramos o sentido elementar expresso? A expressão formal ou fonológica? O módulo gramatical em que é formada? Essa definição não é simples. E que ótimo que seja assim, para que possamos continuar nos divertindo com os fenômenos da linguagem humana. Só espero que, nesse processo, preservemos nossa intuição, senãonossostextospodemficarmuitoconfusos.

Saiba mais:

No livro A linguística no século XXI: convergências e divergências no estudo da linguagem, de Aniela Improta, Lilian Ferrari e Marcus Maia, mencionado neste artigo.

No livro Para conhecer morfologia, de Alessandro Boechat de Medeiros e Maria Cristina Figueiredo, que conta inclusive com discussões no âmbito da Morfologia Distribuída.

No artigo Sem escapatória da Sintaxe: não tente fazer análise morfológica na privacidade do seu próprio léxico, de Alec Marantz. Esse texto teórico foi fundamental para o estabelecimento da Morfologia Distribuída.


  1. Vocábulo formal e vocábulo fonológico são as nomenclaturas usadas originalmente por Mattoso Câmara Jr., preservadas aqui. Para nosso propósito, os termos vocábulo e palavra podem ser intercambiados. ↩︎
  2. Isso poderia parecer anticientífico, mas, na verdade, é muito comum em empreendimentos científicos. Por exemplo, na física, certas definições, como a de massa, não são muito boas. No entanto, esse conceito pode ser utilizado em diversas formulações tão importantes e frutíferas cientificamente quanto famosas: a equação da energia de Einstein, a da segunda lei de Newton, momento, gravidade… Agradeço ao professor Alessandro Boechat por trazer esse fato à minha atenção. ↩︎
  3. Os estudos linguísticos costumam utilizar glosas para apresentar os dados claramente. Na primeira linha, temos o dado da língua original, o que é uma única palavra nesse caso. A seguir, temos a segmentação morfológica dessa palavra, com a separação de seus itens constitutivos. Alinhados abaixo, temos os significados de cada um desses morfemas. Por exemplo, r expressa a informação de 3ª pessoa do plural (codificada em eles, no português); e õ expressa a negação (sinalizada por não, no português). Por último, na quarta linha, temos a tradução do termo original para a língua deste texto, o português. ↩︎

(Baixe a versão em pdf do texto)

[Outros textos de divulgação: leia aqui].