Corpus de aprendiz & verbos modais: Avaliando a escrita de pesquisadores brasileiros em inglês moreThe PDF file contains an uncorrected proof of the chapter:
|
18 views |
Academic Writing, English for Academic Purposes, Corpus Linguistics, English language, Second Language Writing, Applied Linguistics, and English Modal Verbs
Corpus de aprendiz & verbos modais:
aval!ando a escrita de pesquisadores
brasileiros em ingles1
Vander Viana (PUC-Rio)
ABSTRACT: Corpus-based studies allow researchers to investigate
language in use and not models of language. Following the principles
of Corpus Linguistics, this study aims at analyzing the modal verbs
which are used by Brazilian researchers from the fields of Linguistics
and Literature when writing scientific articles in English. To this end, a
research corpus was compiled from 49 articles, totaling 208,614 tokens
and 12,791 types. This study covers the usage of nine modal verbs —
'can', 'could', 'may', 'might', 'shall', 'should', 'will', 'would' and 'must'.
The profile traced in this research is compared to the one by Biber et
al. (1999) in their description of academic prose in the English language.
The results indicate how close the writing of the two groups of subjects
is, thus possibly indicating subjects' proficiency in English.
1) Intro du9ao
Atualmente muitos estudos tem se pautado pelos princlpios
teoricos da Lingulstica de Corpus, uma vez que esta area do co-
nhecimento permite a realiza^ao de investigates lingulsticas
baseadas em grandes quantidades de dados reais, sempre auxiliadas
por computador. Podem-se investigar corpora das mais diversas
naturezas, incluindo-se dados orais ou escritos, textos originais
1 Esta e uma versao do trabalho final apresentado a Profa. Dra. Lucia Pacheco
de Oliveira no 2° semestre de 2006 na Pontificia Universidade Catolica do Rio
de Janeiro. Agradeco a professora por seus comentarios crlticos.
65
ou traduzidos, registros determinados ou uma lingua como um
todo, entre outras possibilidades.
Objetiva-se aqui investigar um corpus representative de um re-
gistro especifico, a saber, prosa academica, constituldo de artigos em
ingles publicados em anais e/ou periodicos disponibilizados na
internet. Como os sujeitos de pesquisa sao brasileiros, a colecao de
textos pode ser classificada como corpus de aprendiz uma vez que os
dados nele incluldos foram produzidos por falantes de ingles como
lingua estrangeira (LE). Os resultados encontrados serao compara-
dos com os obtidos por Biber et alii (1999) em seu mapeamento
da prosa academica em ingles como primeira lingua (LI).
Em um estudo anterior, Viana (2006b) levantou os feixes
lexicais2 neste mesmo corpus de forma a comparar esta producao
com a escrita de pesquisadores em ingles como LI. Dada a seme-
lhanca dos padroes estruturais e funcionais dos feixes encontra-
dos nos dois corpora, apontou-se como uma posslvel explicacao
para este fato proficiencia dos sujeitos de pesquisa.
Apesar de os mesmos dados serem utilizados aqui, o presen-
te trabalho tern como meta a investigacao de um traco lingulstico
mais especifico, a saber, a utilizacao de verbos modais na escrita
academica em ingles de pesquisadores brasileiros. As perguntas
de pesquisa que norteiam este estudo sao:
(a) Os pesquisadores brasileiros utilizam verbos modais em
sua prosa academica da mesma forma que falantes de ingles como
LI o fazem?
(b) Em caso negativo, quais sao as diferencas entre estes dois
grupos?
O texto estrutura-se em quatro partes. Inicialmente, faz-se
uma revisao da literatura com vistas a explicitacao de conceitos
como Lingulstica de Corpus e verbos modais. Posteriormente,
discute-se o procedimento metodologico empregado tanto na
2 Os feixes lexicais sao definidos como "as seqiiencias lexicais recorrentes
mais freqiientes em um registro" (BIBER et alii, 2004, p. 376).
66
coleta quanto no tratamento de dados. Em um terceiro momen-
to, sao apresentados os resultados encontrados a partir desta pes-
quisa. Finalmente, algumas conclusoes sao tecidas com base no
estudo realizado.
2) Revisao da literatura
Nesta secao, sao explicitados dois aspectos principals do
presente trabalho: a Lingulstica de Corpus e os verbos modais. Na
primeira subsecao, enfoca-se o significado da palavra 'corpus' para
a area do conhecimento na qual este trabalho se insere. Define-
se tambem a Lingulstica de Corpus e diferencia-se a mesma da
tradicao gerativista. Na segunda subsecao, discorre-se a respeito
dos verbos modais e suas diferentes classificacoes em tres gra-
maticas da lingua inglesa. Adicionalmente, nesta subsecao, sao
revisados estudos baseados em corpora que tratam, de forma dire-
ta ou indireta, da utilizacao de verbos modais por aprendizes de
ingles como LE e/ou falantes de ingles como LI.
2.1) Lingulstica de Corpus
Apesar de haver muitas pesquisas de cunho lingulstico e
ate mesmo literario que se utilizam de um corpus (ou corpora), e
importante especificar exatamente o que se entende por corpus.
Segundo o Novo Aurelio seculo XXI (FERREIRA, 1999, p. 561),
a palavra 'corpus7 tern tres acepcoes: (1) "conjunto de docu-
mentos, dados e informacoes sobre determinada materia", (2)
"toda a obra atribuida a um escritor" e (3) "conjunto finito de
materials significantes (enunciados lingulsticos, capas de revis-
tas, etc.) constituldo com vistas a analise semiologica". Estes
sao sentidos gerais que acabam por nao refletir o significado
de tal palavra na area de Lingulstica de Corpus. McEnery e
Wilson (1996, p. 21) resumem bem esta divergencia no signi-
ficado da palavra em questao:
67
em principio, qualquer colecao de mais de um texto pode ser
chamada de corpus: o termo 'corpus* e simplesmente a palavra
latina para 'corpo'; um corpus, portanto, pode ser definido como
qualquer corpo de texto. [...] Porem, quando utilizado no con-
texto da Lingulstica moderna, o termo 'corpus' tende
frequentemente a ter conotacoes mais especlficas do que esta
definicao oferece.3
Um corpus, portanto, adquire caracterlsticas especlficas no
ambito da Lingulstica de Corpus. Reproduzem-se abaixo, em
ordem cronologica, algumas definicoes4 para tal conceito na
literatura especlfica:
a corpus is a collection of naturally-occurring language text,
chosen to characterize a state of variety of a language.
(SINCLAIR, 1991, p. 171)
[a corpus is a] computer readable collection of texts or transcripts
which can be accessed and interrogated selectively using text
retrieval or concordancing software (ASTON, 1997, p. 205)
A collection of spoken and written texts, organized by register
and coded for other discourse considerations, comprises a
corpus. (BIBER et alii, 1999, p. 4)
A corpus can be defined as a collection of texts assumed to be
representative of a given language put together so that it can be
used for linguistic analysis. (TOGNINI-BONELLI, 2001, p. 2)
A corpus is a large, principled collection of naturally-occurring
texts that is stored in electronic form (accessible on computer).
(CONRAD, 2002, p. 76)
3 Traducao livre do seguinte fragmento: "in principle, any collection of more
than one text can be called a corpus: the term 'corpus' is simply the Latin for
'body', hence a corpus may be defined as any body of text. [...] But the term
'corpus' when used in the context of modern linguistics tends most frequently
to have more specific connotations than this simple definition provides for".
4 Excepcionalmente nesta parte do trabalho optou-se por manter as citacoes
na lingua em que elas foram originariamente escritas (neste caso, a lingua
inglesa) para que se mantivesse a ideia original de cada teorico.
68
Ao analisar as cinco definicoes para 'corpus', e posslvel notar
a existencia de algumas caractensticas peculiares a tal construto
teorico. Para que uma colecao de textos seja considerada um corpus,
ela deve conter textos autenticos e naturais, ou seja, estes nao
podem ser produzidos por computador e/ou inteligencia artifi-
cial, por exemplo. Com relacao a compilacao, a mesma deve ser
realizada de forma seletiva e ordenada com um proposito defini-
do e especlfico. Quanto ao formato, os textos devem ser leglveis
por computador. Por fim, a selecao deve ser representativa do
uso lingulstico que se deseja analisar.
Um corpus difere de um texto de varias maneiras, como aponta
Tognini-Bonelli (2001, p. 2). A leitura do primeiro e fragmenta-
da, vertical e tern o objetivo de identificar eventos repetidos que
formem padroes. A leitura do segundo, por outro lado, e realizada
por inteiro e na direcao horizontal com o objetivo de entender o
conteudo do mesmo. Enquanto um corpus e lido como uma re-
presentacao de pratica social, um texto e lido como um ato de
vontade individual. Deve-se tambem ressaltar que, ao passo que
um texto constitui um evento comunicativo coerente, nao se deve
esperar da leitura de um corpus a mesma coerencia.
Uma vez tendo definido o sentido da palavra 'corpus', pode-
se esclarecer o que se entende por Lingulstica de Corpus. Segun-
do McEnery e Wilson (1996, p. 1), esta area do conhecimento
pode ser descrita como o estudo da linguagem calcada em ins-
tancias reais de uso lingulstico. A Lingulstica de Corpus difere dos
estudos baseados na tradicao Chomskyana justamente por se
apoiar em dados reais. Enquanto a primeira area se ocupa da
linguagem em uso e parte dos exemplos para chegar as generali-
zacoes, a segunda utiliza a introspeccao como forma de obten-
cao de dados, partindo de generalizacoes para comprova-las com
exemplos geralmente inventados. Se, por um lado, a Lingulstica de
Corpus se interessa em revelar padroes de uso de uma determina-
da lingua, o Gerativismo se preocupa em descobrir universais
lingulsticos que possam ser aplicados a todas as lfnguas. Em outras
69
palavras, a primeira area tem por foco a probabilidade de uso de
um determinado traco lingulstico enquanto a segunda se preocu-
pa com a ocorrencia de uma dada categoria em uma determinada
posicao. Segundo Sinclair (2003, p. ix), "antes da disponibilizacao
de grandes quantidades de dados, muitas das generalizacoes tinham
de ser feitas intuitivamente; nao era posslvel verificar nocoes na
era anterior a Lingiilstica de Corpus"s. Decorre dai, portanto, que
nao ha mais motivos para que se dependa unicamente de intuicoes
para a analise lingiilstica, ja que a popularizacao dos computadores
hoje em dia permite que um analista investigue corpora extensos
em questao de segundos.
2.2) Verbos modais
Esta subsecao encontra-se divida em duas partes. Primeira-
mente, sao oferecidas descricoes gramaticais para os verbos
modais. Em um segundo momento, discorre-se a respeito de es-
tudos baseados em corpora que abordam o uso de tais verbos na
escrita de aprendizes de lingua inglesa e/ou de falantes de ingles
como LI.
2.2.1) Descrigao gramatical
Praticamente todas as gramaticas da lingua inglesa incluem um
capitulo ou uma secao a respeito dos verbos modais. Tanto gramaticas
mais pedagogicas voltadas para o estudante, como a de Swan (1998),
quanto gramaticas mais preocupadas com a descricao linguistica,
como a de Biber et alii (1999), tratam deste assunto, indicando assim
que a modalizacao constitui-se em um aspecto relevante.
Swan (1998), por exemplo, descreve os verbos modais de
uma forma generalizante. Agrupa Qcan\ 'could, cmay\ imight\ 'will\
5 Tradu^ao livre do seguinte fragmento: "before large amounts of data were
easily available, most of the generalisation had to be done by intuitive
guesswork; pre-Corpus Linguistics were not able to check their notions".
70
'would, 'shall, 'should, 'must e 'ought em uma mesma categoria, a
saber, Verbos modais auxiliares'. Afkma tambem que 'need, 'dare1
e 'had bettef podem ser empregados como Verbos modais auxiliares',
sem que os mesmos sejam diferenciados dos outros verbos modais
como 'caff e 'could, por exemplo. Este tratamento de verbos modais
pode estar relacionado a proposta do autor de apresentar topicos
gramaticais de forma pratica e pouco complicada apesar de seu
publico-alvo ser constituldo por professores de ingles, como indi-
cado em sua introducao.6 Apesar de ser clara e de possivelmente
atender aos anseios de estudantes de lingua inglesa, o tratamento
dispensado por Swan a questao dos verbos modais nao se alinha
ao objetivo desta investigacao, que invariavelmente exige uma
descricao mais detalhada a respeito nao so dos verbos modais
propriamente ditos, mas tambem de seus respectivos empregos.
Uma abordagem diferente a questao e oferecida pela Collins
Cobuild English Gramma? (SINCLAIR, 1990). Esta foi a primeira
gramatica da lingua inglesa cuja descricao se baseou na analise de
dados reais compilados no corpus de Birmingham. Diferentemente
de Swan (1998), Sinclair (1990) propoe que os verbos modais
sejam classificados em duas categorias distintas: Verbos modais'
e Verbos semi-modais'. Na primeira categoria, sao agrupados
'can\ 'could, 'may, 'might, 'must, 'ought to\ 'shall', 'should, 'wilt e
'would. A segunda categoria engloba 'dare\ 'need e 'used to\ Esta
gramatica, contudo, descreve a lingua inglesa de uma forma geral
sem fazer distincao entre os diferentes registros que compoem
uma determinada lingua.
6 Le-se na introducao a obra de Swan (1998, p. xi): "The book is intended for
intermediate and advanced students, and for teachers of English.". Mais adiante
quando explicita a abordagem e o estilo da obra, o autor escreve que
"explanations are, as far as possible, in simple everyday language. Where it has
been necessary to use grammatical terminology, I have generally preferred to
use traditional terms that are well known and easy to understand. Some of
these terms (e.g. future tense) would be regarded as unsatisfactory by academic
grammarians, but I am not writing for specialists".
71
Apesar de seguir a tradicao de Sinclair (1990) e tambem se
apoiar em dados reais, a Longman Grammar of Spoken and Written
English (BIBER et alii, 1999) apresenta uma abordagem diferen-
te. De acordo com esta gramatica, os verbos modais podem ser
categorizados em tres grupos, a saber, Verbos modais', Verbos
auxiliares marginais' e Verbos semi-modais'.
O primeiro grupo possui algumas caracteristicas
identificadoras como (a) serem formas invariaveis, (b) precede-
rem o sujeito em perguntas que exigem resposta sim ou nao e (c)
serem seguidos por um verbo na forma infinitiva sem 'to' (BIBER
et alii, 1999, p. 483). Nele estao inseridos 'cat?, 'could, 'may\ 'might,
'shall', 'should, 'will, 'would e 'must.
Os verbos auxiliares marginais correspondem a 'need (toj,
'ought to\ 'dare (toj e 'used to\ De acordo com Biber et alii (1999, p.
484), estes verbos sao raros e estao presentes praticamente so-
mente no ingles britanico.
Ja as expressoes idiomaticas fixas como '(had) better', 'have to\
'(have) got to\ 'be supposed td e 'be going td sao consideradas verbos
semi-modais por Biber et alii (1999, p. 484). Eles diferem dos
outros grupos por poderem ter marcacao tanto de tempo como
de pessoa e por poderem ser utilizados como formas infinitas.
Emprega-se neste trabalho a descricao de verbos modais de
Biber et alii (1999) uma vez que esta obra de referenda, diferen-
temente de Sinclair (1990), considera as caracteristicas gramati-
cais de acordo com cada registro analisado, a saber, conversa,
ficcao, linguagem jornalfstica e prosa academica.
2.2.2) Estudos baseados em corpora
Os nove verbos modais agrupados por Biber et alii (1999)
na primeira categoria tambem sao chamados de Verbos modais
centrais' em Wilson (2005), que afirma que tais verbos tern sido
muito focalizados pelos teoricos devido a sua alta complexidade
semantica (WILSON, 2005, p. 151).
72
Um estudo que aborda indiretamente esta questao e o de
Mindt (1996), em que o autor argumenta que apesar de a Lin-
giilstica de Corpus ja ter influenciado materials de referenda como
dicionarios e gramaticas, os livros didaticos para o ensino de in-
gles como LE continuam inalterados. Usando uma parte do
London-Lund Corpus, ele argumenta que 'would', ccarf e 'will sao os
verbos modais mais comuns em seu corpus. Considerando que
"as formas presentes ocorrem mais frequentemente em oracoes
principals do que as formas passadas"7, (MINDT, 1996, p. 234) e
que 'will e um verbo modal extremamente freqiiente em conver-
sas em ingles, Mindt (1996) propoe que livros didaticos alemaes
de ingles como LE devem introduzir tal verbo modal no primei-
ro ano de estudo em vez de faze-lo no segundo. Em outras pala-
vras, a apresentacao de 'will nao deve ser adiada em favor de
'must e imay\ que sao verbos modais menos frequentes.
O estudo de Ringbom (1998) tambem aborda a questao da
utilizacao de verbos modais quando compila as freqiiencias
vocabulares na escrita de estudantes de ingles de sete nacionali-
dades diferentes (holandesa, fino-sueca, finlandesa, francesa, ale-
ma, espanhola e sueca). Os sete subcorpora, partes integrantes do
projeto denominado International Corpus of Learner English (ICLE),
foram comparados ao Louvain Corpus of Native English Essays
(LOCNESS), composto por redacoes argumentativas de estudan-
tes americanos e britanicos. Apesar de nao haver uma explicacao
completa a respeito das 110 palavras mais frequentes apresenta-
das no artigo, podem-se perceber algumas diferencas entre os
grupos analisados. Parece que todos os grupos de estudantes uti-
Hzam 'cart em demasia e subutilizam 'would e 'will. Uma unica
excecao concerne o grupo frances que emprega 'wilt
frequentemente. Em relacao ao verbo modal 'should, espanhois,
7 Tradu^ao livre do seguinte fragmento: "the present forms occur more
frequently in main clauses than the past forms".
73
fino-suecos, suecos e holandeses geralmente o subutilizam en-
quanto alemaes, finlandeses e Franceses tendem a fazer uso do
mesmo mais comumente do que americanos e britanicos. Quanto
ao verbo modal 'could, ha tres resultados distintos: (a) os estudantes
finlandeses lancam mao deste verbo modal da mesma forma que
seus pares americanos e britanicos; (b) os alunos espanhois em-
pregam-no em maior escala; e (c) todos os outros cinco grupos
nacionais subutilizam-no. Em vez de oferecer uma interpretacao
completa a respeito dos dados apresentados no artigo, Ringbom
(1998, p. 51) conclui que
[o] capltulo tentou mostrar como uma aparentemente sim-
ples contagem de frequencia de palavras pode oferecer um
ponto de partida util para muitos e interessantes projetos de
escala menor nos quais as caracteristicas gerais da linguagem do
aluno avancado assim como a relativa importancia da transfe-
rencia e das caracteristicas universais podem ser exploradas.8
Apesar de os verbos modais ja terem sido estudados por um
grande numero de lingiiistas de corpus (cf. WILSON, 2005), pare-
ce haver uma lacuna de estudos que enfoquem a producao escri-
ta de estudantes brasileiros de ingles como LE.
No contexto brasileiro, ha, por exemplo, o estudo de Viana
(2006a) acerca da utilizacao de nove verbos modais ('can\ 'could,
'may', 'might, 'shall', 'should, 'mill, 'would e 'musf) na escrita de alunos
de nacionalidade brasileira. Para esta finalidade, utiliza-se um corpus
de redacoes em lingua inglesa escritas por alunos avancados de
ingles como LE, oriundos de cursos livres na Cidade do Rio de
Janeiro. O estudo compara a producao escrita destes aprendizes
8 Tradu^ao livre do seguinte fragmento: "chapter has tried to show that a
seemingly simple word frequency count may provide a useful starting point
for many interesting small-scale projects where the general characteristics of
advanced learner language as well as the relative importance of transfer and
universal features can be further explored".
74
a producao escrita de falantes de ingles como LI. Os resultados
sugerem que os sujeitos de pesquisa utilizam em demasia verbos
modais que indicam volicao ou predicao9, espedalmente cwilt.
Aponta-se tambem a subutilizacao de verbos modais em sintagmas
verbais na voz passiva. O estudo conclui que a escrita dos sujei-
tos investigados se aproxima da producao oral de falantes de in-
gles como LI, o que contraria as expectativas iniciais, ja que os
mesmos estao prestes a concluir seus estudos.
Este trabalho pretende dar continuidade a pesquisa de Viana
(2006a) ao analisar a escrita de uma populacao diferente. Dei-
xam-se de lado os estudantes de ingles de cursos livres para in-
vestigar pesquisadores brasileiros, que, como se acredita, devem
ser proficientes em lingua inglesa. Assim sendo, espera-se que os
resultados encontrados sejam semelhantes a prosa academica
descrita por Biber et alii (1999) e, contrariamente, distintos dos
resultados encontrados por Viana (2006a).
3) Metodologia
Dado que o presente estudo tern como objetivo mapear a
utilizacao de verbos modais na prosa academica em lingua inglesa
de pesquisadores brasileiros, foi necessario compilar um corpus
de estudo que representasse tal uso lingulstico. Para tanto, decidiu-se
coletar artigos cientlficos publicados em periodicos especializados
e anais de eventos disponlveis em meio eletronico.
Como o material foi obtido na internet, nao foi preciso digitar
ou digitalizar os artigos que foram incluldos no corpus. No entanto,
alguns criterios de formatacao tiveram que ser estabelecidos para
que os textos pudessem ser convertidos em arquivos TXT (texto
sem formatacao) e, desta forma, lidos pela ferramenta computacional.
9 Apesar deste emprego, Viana (2006a) ressalta que nao ha nenhuma instancia
de 'shall no corpus por ele investigado.
75
Decidiu-se, entao, pela manutencao de titulos, subtltulos e
citacoes curtas. As citacoes curtas sao aquelas que estao integra-
das ao corpo do texto, ou seja, aquelas que ocupam menos de
tres linhas de acordo com as normas da ABNT.
Por outro lado, foram excluldos resumos, palavras-chaves,
citacoes longas, notas (de rodape ou de fim), quaisquer tipos de
elementos graficos e referencias bibliograficas. Os resumos fo-
ram desconsiderados porque eles podem ser tratados como um
genero distinto. As palavras-chave foram descartadas por nao
contribulrem para o estudo em tela. As citacoes longas - ou seja,
aquelas destacadas do paragrafo — foram excluldas porque elas
representam vozes de outras pessoas que nao a dos autores do
artigo na maioria dos casos. Apesar de se ter certeza de que os
autores dos artigos eram brasileiros, tal assercao nao poderia ser
feita no caso das citacoes. Entao, de forma a evitar que a produ-
cao escrita de uma pessoa de nacionalidade nao-brasileira fos-
se inclulda na analise, optou-se por excluir tais citacoes. Ape-
sar de as notas de rodape ou de fim serem produtos da escrita
de pesquisadores brasileiros, elas tiveram de ser suprimidas, ja
que o programa computacional nao leria corretamente os nu-
meros sobrescritos que indicam tais notas. Ou o programa
leria 'palavral', o que seria diferente de 'palavra', ou 'palavra
1', o que acabaria por gerar a inclusao de um item lexical (o
numero '1') na contagem final de palavras. Igualmente por
causa da limitacao do formato TXT, foram excluldas tabelas,
figuras, ilustracoes e graficos de todos os artigos. Por fim, foi
deixada de fora do corpus a secao de referencias bibliograficas,
indispensavel dentro do genero artigo cientlfico; porem, des-
necessaria para o presente estudo.
Ao todo, ha no corpus 49 artigos cientlficos escritos em
lingua inglesa por 50 pesquisadores10 brasileiros das areas de
Um artigo que integra o corpus foi escrito por dois pesquisadores conjuntamente.
76
Lingiilstica e Literatura. Os artigos foram coletados em 11 fon-
tes distintas disponlveis em meio digital. O corpus contem 208.614
kens11 e 12.791 formas12.
A metodologia envolveu a utilizacao de um programa de
analise textual chamado WordSmith Tools (SCOTT, 1999), que
contempla tres ferramentas: WordUst, Concorde KeyWords. A fer-
ramenta WordUst fornece listas de palavras existentes em um
dado corpus em ordem de freqiiencia ou alfabetica. Esta mesma
ferramenta tambem gera dados especlficos a respeito da cole-
cao de textos investigada como o numero de formas, itens, pa-
ragrafos, entre outros. O Concord, por sua vez, compila linhas
de concordancia que, segundo Conrad (2002, p. 75), "exibem
todas as ocorrencias de uma palavra ou estrutura em uma base
de dados com uma pequena quantidade de contexto13 em cada
lado"14. Finalmente, a ferramenta KeyWords e empregada para
comparar duas listas de palavras com vistas a verificacao do
que e caracteristico de um corpus de pesquisa quando compara-
do a um corpus de referenda.
11A palavra 'item' refere-se a cada palavra no corpus. Utiliza-se tambem a palavra
'ocorrencia' neste sentido.
12 Refere-se aqui ao numero de palavras distintas existentes no corpus. Na
literatura especlfica, pode-se encontrar a palavra 'vocabulo' como sinonimo
para este termo.
13 Apesar de Conrad (2002, p. 75) utilizar a palavra 'contexto' (^context no
original em ingles), opta-se no escopo deste trabalho pela utilizacao da palavra
'cotexto' para se referir ao mesmo fenomeno. Sinclair (2003, p. 174) define
'cotexto' como um grupo de palavras que ocorre em ambos os lados de uma
determinada palavra de busca em um texto. Desta forma, tem-se que 'cotexto'
e utilizado para se referir ao ambiente lingulstico no qual uma palavra ou
expressao esta inserida enquanto 'contexto' e utilizado para se referir as
restricoes situacionais e/ou culturais como advogado pela Lingiilstica
Sistemico-Funcional.
14 Traducao livre do seguinte fragmento: "These listings display all the
occurrences of a word or structure in a database, with a small amount of
context on each side".
77
Para a presente pesquisa, utilizaram-se duas ferramentas em
especial: WordUsl e Concord. Com a primeira, foi posslvel listar os
verbos modais mais freqiientes no corpus de pesquisa.15 Esta
listagem pode ser ordenada de acordo com criterios alfabetico
ou de frequencia, como ilustra a Figura 1.
.r.lii |.>rw_--,idli "IE i
n 1 fit- .JVIi^ Gwmmbi hL ViTUti H'
o i .. ■ ■ 3 £ i- *a I]
^^^^
Ij-l..
MAT □.lfl
WILL 0.15
390 ■j 'J wcQdn|1>rwaJd
D li tfqtfdhtf
:oui_b 1st 009 CftJdnM)
lie 0.07
ICS
a-wx
Figura 1: Tela do WordUst (ordem de frequencia)
Em uma mesma linha, alem do verbo modal, ha tambem
informacao a respeito da frequencia do mesmo em termos
absoluto e percentual, bem como os lemas de tal verbo. A
titulo de exemplificacao, pode-se citar o primeiro item na Fi-
gura 1. O verbo 'cart ocorreu 626 vezes, o que representa 0,30%
de todos os itens existentes no corpus. Destas 626 ocorrencias,
105 sao deste verbo na forma negativa por extenso ('cannof) e
521 sao do verbo na forma afirmativa ('can') ou na forma ne-
gativa reduzida ('can't).
15 A selecao dos verbos modais foi feita manualmente nesta pesquisa dado
que se trabalha somente com um numero reduzido de formas.
78
Em um segundo momento, utilizou-se a ferramenta Concord
para investigar os ambientes lexicais nos quais os verbos modais
estavam inseridos.
IB-ThIkimI |CAr<iJiJLIM[lh S-J-l .....ht |hM 1IUII..WH
f rk Up Utadw r ^ >wim
|i Qilf ■■■ „ ^ ■ ■ ■ "jt 0 ^
_J wne panpherd pcoubi il • i ■■ bo Mid Ihd! such n iki 1 lei ert language* Frflfliy. It can be mu Uia, despite di 1 i^ing raflUfldons-, *k , rtficfi t an be said to 'French," H fi9 not Wbtr- tful Ite ^Eul5 C in be 53HI tCi t>* 3HOCK3te
til 1 pined RvidancD tiij q-rdis ■ n be SHtjra|id!iy dnrund — Ml 'I bkU^'jTT prMIIOLtz [« l^S'itd. Old IllbCflOUl 1 r- thai no tatesflal body diet =' be Men **di tt^e naked 1 h, me propel reported here >: n be »an a& ndino in a i 1. SB*nsn Rij&hdiG'S "foncH1 C-Sn be MRnflS imrwrsBdi 1 rianr-^iG^or'Q "yir.aijdicrrE, r .xi b* Hon inrnrruphnrn J VVhlfl thii BHompk l an be »rn » srnpksbc. Imeni towards, due rastfidion c*i be aefcn dl d«s pura itv _H I iJl
Figura 2: Tela do Concord ('can' como palavra de busca)
E atraves desta ferramenta que se torna posslvel no tar os
padroes de utilizacao dos verbos modais. No caso da selecao fei-
ta na Figura 2, pode-se perceber que todas as instancias de 'cart
sao seguidas do verbo 'to hi e de um verbo no particlpio passado,
caracterizando assim o uso da voz passiva nas treze linhas de
concordancia exibidas.
Os dados observados na escrita de pesquisadores brasileiros
foram contrastados a descricao presente na Longman Grammar of
Spoken and Written English (BIBER et alii, 1999). Os autores desta
gramatica analisaram o Longman Spoken and Written English Corpus
de forma a descrever "o uso real de caracteristicas gramaticais
em diferentes variedades do ingles: principalmente em conversa,
79
ficcao, linguagem jornalfstica e prosa academica"16 (BIBER et
alii, 1999, p. 4). Na presente pesquisa, optou-se pela comparacao
dos dados analisados com o registro 'prosa academica' descrito
na gramatica supracitada.
4) Analise de dados
Como anteriormente explicitado, o escopo deste trabalho
consiste na investigacao de 'caff, ''could, 'may,'might', 'shall,''should',
'will, ''would e 'must, denominados de Verbos modais' por Biber
et alii (1999), na escrita academica de pesquisadores brasileiros
das areas de Lingulstica e Literatura.
Estes verbos podem ser agrupados de duas formas: (a) pela
referenda temporal que podem fazer e (b) pela ideia que eles
transmitem. Em relacao a referenda temporal, os verbos modais
podem ser classificados em dois grupos: os que nao se referem
ao passado e os que podem fazer tal referenda. Encontram-se,
no primeiro grupo, 'maff, 'caff, 'will e 'shall; enquanto 'might, 'could',
'would e 'should estao no segundo. A diferenca de uso destes dois
grupos e grande, como ilustra a Tabela 1.
Tabela 1: Distribuicao de verbos modais no corpus de pesquisa (referenda
temporal)
Referenda outra que r, lao ao passado Vossivel referenda ao passado Total
Verbo modal Porcentagem Verbo modal Porcentagem
'May' 78,86% 'Might' 21,14% 100%
'Can' 77,00% 'Could' 23,00% 100%
wur 51,42% Would' 48,58% 100%
'Shall' 2,59% 'Should' 97,41% 100%
16 Traducao livre do seguinte fragmento: "describes the actual use of grammatical
features in different varieties of English: mainly conversation, fiction, newspaper
language, and academic prose".
80
Verifica-se que os dois primeiros verbos que nao podem fa-
zer referenda ao passado ('may' e 'can*) sao aproximadamente tres
vezes mais freqiientes que seus pares ('mighf e 'could, respectiva-
mente). No caso do par 'will e "would', o primeiro tambem e mais
freqiiente; porem, a diferenca percentual de uso entre ambos e
bastante reduzida. Ha uma distribuicao quase uniforme ja que o
primeiro ocorre 51,42% no corpus e o segundo, 48,58%. Contu-
do, e na analise do par 'shall e 'should que se pode notar uma
discrepancia na utilizacao dos mesmos com 'should sendo muito
mais freqiiente do que 'shall. Na verdade, o verbo 'shall mostra-
se extremamente infreqiiente, ocorrendo apenas 2,59% no corpus
de pesquisa.
Os resultados para a prosa academica de brasileiros e seme-
lhante aos reportados por Biber et alii (1999, p. 486). Segundo
estes pesquisadores, "o verbo que pode expressar tempo passa-
do e menos freqiiente do que o seu par em todos os casos com
excecao de shall/should'11. Tambem se registra na gramatica que
'shall e raramente utilizado nos artigos cientlficos escritos por
falantes de ingles como LI.
Em relacao as ideias, os verbos modais podem ser classifica-
dos em tres grupos (cf. BIBER et al., 1999, p. 489): (a) permis-
sao, possibilidade ou habilidade ('caff, 'could', 'may' e 'might), (b)
volicao ou predi^ao ('will, 'would e 'shall), e (c) necessidade ou
obrigacao (^should e 'must). A Tabela 2 indica as freqiiencias ab-
solutas de cada um dos verbos modais por grupo.
17 Tradu^ao livre do seguinte fragmento: "the tentative/past time member is
less frequent that its partner in all cases except shall/should
81
Tabela 2: Distribuicao de verbos modais no corpus de pesquisa (ideias)
Ideias Verbos modais Ocorrencias
Permissao 'can' 626
Possibilidade 'could' 187
Habilidade 'may' 403
'might' 108
Volicao 'will' 307
Predicao 'would' 290
'shall' 7
Necessidade 'should' 263
Obrigacao 'must' 146
O uso de verbos da cada grupo semantico e representado
no Grafico 1.
□ Permissao /
Possibilidade /
Habilidade
□ Volicao /
Predicao
□ Necessidade /
Obrigacao
Corpus de aprendiz
Grafico 1: Emprego de verbos modais por grupo semantico
Uma vez verificada a distribuicao dos nove verbos modais
no corpus de estudo, pode-se comparar os resultados do Grafico
1 ao mapeamento de verbos modais no registro prosa academica
82
realizado por Biber et alii (1999, p. 489). Os pesquisadores bra-
sileiros das areas de Lingulstica e Literatura tendem a utilizar
verbos modais na mesma proporcao que seus pares, falantes de
ingles como LI. Em outras palavras, ha um grande emprego de
verbos modais que indicam permissao, possibilidade ou habili-
dade com mais de 50% das instancias. Com mais de 25% das
instancias, tem-se verbos que indicam volicao ou predicao. O
grupo menos freqiiente na escrita de ambos os grupos de sujei-
tos e aquele que indica necessidade ou obrigacao.
Uma outra caracteristica da prosa academica em lingua in-
glesa de acordo com Biber et alii (1999) concerne o emprego de
verbos modais na voz passiva. Como eles afirmam, a voz passiva
com tais verbos e rara em conversa e ficcao, mas e relativamente
comum para alguns destes verbos na prosa academica (BIBER et
alii, 1999, p. 499).
No corpus de aprendiz, apesar de os sintagmas verbais que
contenham verbos modais estarem majoritariamente na voz ati-
va, ha certa recorrencia da voz passiva, o que nao foi registrado
na pesquisa de Viana (2006a) com relacao a escrita de alunos de
cursos livres, por exemplo.
83
shall
n might
□ would
□ will
T-ijj.I
[J may
□ can
Voz ativa
Voe pas-siva
Grafico 2: Distribuicao de verbos modais (vozes ativa e passiva)
O Grafico 2 indica que pelo menos 10% de cada um dos
verbos modais sao empregados na voz passiva. A unica excecao
registrada concerne o emprego de 'shall', que sempre ocorre na
voz ativa. Este resultado, contudo, pode ter sido influenciado
pelo tamanho do corpus de estudo, caracterizado como pequeno
por conter apenas 208.614 kens.
O resultado aqui apresentado difere sobremaneira dos re-
sultados encontrados por Viana (2006a). Se os verbos modais
sao utilizados no mlnimo 10% na voz passiva na prosa academi-
ca de brasileiros, somente 'must e 'should eram empregados mais
de 10% em sintagmas verbais na voz passiva na escrita de alunos
de cursos livres. Deve-se ressaltar tambem que 'could e 'should
ocorrem mais de 30% na voz passiva: 35,83% no caso do primei-
ro e 36,12% no segundo caso. Por fim, nota-se tambem que um
verbo modal - 'caff — foi empregado com distribuicao semelhan-
te entre as vozes ativa e passiva. Enquanto 54,63% das instancias
de 'cad foram empregadas na voz ativa, 45,37% das ocorrencias
do mesmo se deram na voz passiva.
84
Os resultados encontrados na investigate) do corpus de apren-
diz sao semelhantes aos reportados por Biber et alii (1999). Os
pesquisadores afirmam que "com a passiva, can e should sao parti-
cularmente comuns, could e must tambem sao razoavelmente co-
muns"18. Foram exatamente estes quatro verbos os mais
freqiientemente utilizados na passiva. A unica diferenca concerne
o emprego mais recorrente de 'may' na voz passiva do que o de
'must. Contudo, a diferenca e reduzida: o primeiro ocorre na voz
passiva em 25,31% ao passo que o segundo e empregado em
23,97% das vezes.
5) Conclusoes
Os resultados deste estudo indicam que os pesquisadores
brasileiros das areas de Lingulstica e Literatura cuja escrita foi
aqui estudada utilizam verbos modais de forma semelhante a prosa
academica de falantes de ingles como LI (cf. BIBER et alii, 1999).
Quando os verbos modais sao analisados sob o ponto de vista da
referenda temporal, verifica-se que os verbos que nao fazem re-
ferenda ao passado (imay\ ccati e em/F) sao mais freqiientes que
seus pares. A unica excecao consiste na utilizacao em larga escala
de 'should (com posslvel referenda ao passado) em comparacao
ao verbo modal 'shall. Com relacao ao significado, a presenca de
verbos modais em ambos os corpora e similar: verbos que deno-
tam permissao, possibilidade ou habilidade sao os mais freqiien-
tes, os que indicam volicao ou predicao ficam em segundo lugar
e aqueles que indicam necessidade ou obrigacao aparecem em
ultimo lugar. Tambem foi verificado que os verbos modais sao
empregados na voz passiva em mais de 10% das instancias em
quase todos os casos. A unica excecao diz respeito ao verbo modal
18 Tradu^ao livre do seguinte fragmento: "with the passive, can and should are
particularly common, could and must
85
'shall, que aparece de forma muito pouco freqiiente no corpus de
pesquisa. Ressalta-se, porem, a distribuicao semelhante de 'cart
nas vozes ativa e passiva.
Ao mapear a escrita de alunos avancados de cursos livres na
Cidade do Rio de Janeiro, Viana (2006a) concluiu que estes sujei-
tos diferem de falantes de ingles como LI com relacao ao empre-
go de verbos modais. Por outro lado, o presente trabalho tracou
um panorama distinto ao mapear a escrita de pesquisadores bra-
sileiros das areas de Lingulstica e Literatura. Enquanto os sujei-
tos anteriormente investigados marcavam em suas redacoes o
uso equivocado de verbos modais, a producao dos sujeitos ora
analisada indica que a utilizacao de verbos modais e compatlvel
com a de falantes de ingles como LI.
O presente estudo confirma a conclusao de Viana (2006b),
que mapeou o mesmo corpus de pesquisa, mas utilizou uma outra
unidade de analise, a saber, os feixes lexicais. Naquele estudo,
Viana (2006b) apontou a proficiencia dos sujeitos de pesquisa
como posslvel conclusao para a semelhanca de estruturas e fun-
coes dos feixes investigados. A partir do mesmo corpus, aqui se
conclui que esta producao escrita tambem se assemelha a descri-
cao gramatical da lingua inglesa como LI mesmo quando a uni-
dade analftica e o verbo modal.
Se, por um lado, a escrita de alunos de cursos livres se dis-
tancia da escrita em ingles como LI e, por outro, a escrita de
pesquisadores brasileiros se aproxima da mesma, resta ainda in-
vestigar populacoes que possivelmente se encontram em outros
estagios de proficiencia. Um encaminhamento para esta pesquisa
e verificar como os verbos modais sao utilizados em redacoes
produzidas por alunos universitarios. A duvida a ser esclarecida
neste caso e se estes alunos ja sao capazes de utilizar verbos modais
tais como os falantes de ingles como LI o fazem ou se este em-
prego pode ser caracterizado como um estagio intermediario entre
as duas populacoes ja investigadas.
86
6) Referencias bibliograficas
ASTON, G. Involving learners in developing learning methods:
exploiting text corpora in self-access. In: BENSON, P.;
VOLLER, P. (Eds.). Autonomy and independence in language
learning Harlow: Longman, 1997. p. 204-214.
BERBER SARDINHA, A. P. LingMstica de Corpus. Sao Paulo:
Manole, 2004.
BIBER, D. et alii. Longman grammar of spoken and written English.
London: Longman, 1999.
BIBER, D.; CONRAD, S.; CORTES, V. If you look at...: lexical
bundles in university teaching and textbooks. Applied
Linguistics, 25, 3, p. 371-405, 2004.
CONRAD, S. Corpus linguistic approaches for discourse analysis.
Annual Review of Applied Linguistics, 22, p. 75-95, 2002.
FERREIRA, A. B. de H. Novo Aurelio seculo XXI: o diciondrio da
linguaportuguesa. 3. ed. Rio de Janeiro: Nova Fronteira, 1999.
HUSTON, S. Corpora in Applied Linguistics. Cambridge: Cambridge
University Press, 2002.
MCENERY, T; WILSON, A. Corpus Linguistics. Edinburgh:
Edinburgh University Press, 1996.
MINDT, D. English Corpus Linguistics and the foreign language
teaching syllabus. In: THOMAS, J.; SHORT, M. (Eds.). Using
corpora for language research. London/New York: Longman,
1996. p. 232-247.
RINGBOM, H. Vocabulary frequencies in advanced learner
English: a cross-linguistic approach. In: GRANGER, S. (Ed.).
Learner English on computer. London/New York: Longman,
1998. p. 41- 52.
SCOTT, M. WordSmith tools3.0. Oxford: Oxford University Press, 1999.
SINCLAIR, J. (Ed.). Collins Cobuild English grammar. London/
Glasgow: Collins, 1990.
_. Corpus, concordance, collocation. Oxford: Oxford University
Press, 1991.
87
_. Reading concordances: an introduction. London: Longman,
2003.
SWAN, M. Practical English usage. Oxford: Oxford University Press,
1998.
TOGNINI-BONELLI, E. Corpus Linguistics at work. Amsterdan/
Philadelphia: John Benjamins Company, 2001.
VIANA, V. P. Modals in Brazilian advanced EFL learners'
compositions: a corpus-based investigation. Profile: Issues in
Teachers Professional Development, 7, p. 77-86, 2006a.
VIANA, V. P. On the other hand: a escrita academica de pesqui-
sadores brasileiros em lingua inglesa. In: ZYNGIER, S.;
VIANA, V; SPALLAN2ANI, A. M. (Ed.). Unguagens e
tecnologias: estudos empiricos. Rio de Janeiro: Publit Solucoes
Editorials, 2006b. p. 263-287.
WILSON, A. Modal verbs in written Indian English: a quantitative
and comparative analysis of the Kolhapur corpus using
correspondence analysis. ICAME Journal, 29, p. 151-169, abr.
2005. Disponlvel em: <http://gandalf.aksis.uib.no/icame/
ij29/ij29-pagel51-170.pdf>. Acesso em: 30 jun. 2006.
88