Corpus de aprendiz & verbos modais: Avaliando a escrita de pesquisadores brasileiros em inglês more

The PDF file contains an uncorrected proof of the chapter:
Viana, V. (2007). Corpus de aprendiz & verbos modais: Avaliando a escrita de pesquisadores brasileiros em inglês. In S. Zyngier, V. Viana & J. Jandre (Eds.), Textos e leituras: Estudos empíricos de língua e literatura (pp. 65-88). Rio de Janeiro: Publit.

Corpus de aprendiz & verbos modais: aval!ando a escrita de pesquisadores brasileiros em ingles1 Vander Viana (PUC-Rio) ABSTRACT: Corpus-based studies allow researchers to investigate language in use and not models of language. Following the principles of Corpus Linguistics, this study aims at analyzing the modal verbs which are used by Brazilian researchers from the fields of Linguistics and Literature when writing scientific articles in English. To this end, a research corpus was compiled from 49 articles, totaling 208,614 tokens and 12,791 types. This study covers the usage of nine modal verbs — 'can', 'could', 'may', 'might', 'shall', 'should', 'will', 'would' and 'must'. The profile traced in this research is compared to the one by Biber et al. (1999) in their description of academic prose in the English language. The results indicate how close the writing of the two groups of subjects is, thus possibly indicating subjects' proficiency in English. 1) Intro du9ao Atualmente muitos estudos tem se pautado pelos princlpios teoricos da Lingulstica de Corpus, uma vez que esta area do co- nhecimento permite a realiza^ao de investigates lingulsticas baseadas em grandes quantidades de dados reais, sempre auxiliadas por computador. Podem-se investigar corpora das mais diversas naturezas, incluindo-se dados orais ou escritos, textos originais 1 Esta e uma versao do trabalho final apresentado a Profa. Dra. Lucia Pacheco de Oliveira no 2° semestre de 2006 na Pontificia Universidade Catolica do Rio de Janeiro. Agradeco a professora por seus comentarios crlticos. 65 ou traduzidos, registros determinados ou uma lingua como um todo, entre outras possibilidades. Objetiva-se aqui investigar um corpus representative de um re- gistro especifico, a saber, prosa academica, constituldo de artigos em ingles publicados em anais e/ou periodicos disponibilizados na internet. Como os sujeitos de pesquisa sao brasileiros, a colecao de textos pode ser classificada como corpus de aprendiz uma vez que os dados nele incluldos foram produzidos por falantes de ingles como lingua estrangeira (LE). Os resultados encontrados serao compara- dos com os obtidos por Biber et alii (1999) em seu mapeamento da prosa academica em ingles como primeira lingua (LI). Em um estudo anterior, Viana (2006b) levantou os feixes lexicais2 neste mesmo corpus de forma a comparar esta producao com a escrita de pesquisadores em ingles como LI. Dada a seme- lhanca dos padroes estruturais e funcionais dos feixes encontra- dos nos dois corpora, apontou-se como uma posslvel explicacao para este fato proficiencia dos sujeitos de pesquisa. Apesar de os mesmos dados serem utilizados aqui, o presen- te trabalho tern como meta a investigacao de um traco lingulstico mais especifico, a saber, a utilizacao de verbos modais na escrita academica em ingles de pesquisadores brasileiros. As perguntas de pesquisa que norteiam este estudo sao: (a) Os pesquisadores brasileiros utilizam verbos modais em sua prosa academica da mesma forma que falantes de ingles como LI o fazem? (b) Em caso negativo, quais sao as diferencas entre estes dois grupos? O texto estrutura-se em quatro partes. Inicialmente, faz-se uma revisao da literatura com vistas a explicitacao de conceitos como Lingulstica de Corpus e verbos modais. Posteriormente, discute-se o procedimento metodologico empregado tanto na 2 Os feixes lexicais sao definidos como "as seqiiencias lexicais recorrentes mais freqiientes em um registro" (BIBER et alii, 2004, p. 376). 66 coleta quanto no tratamento de dados. Em um terceiro momen- to, sao apresentados os resultados encontrados a partir desta pes- quisa. Finalmente, algumas conclusoes sao tecidas com base no estudo realizado. 2) Revisao da literatura Nesta secao, sao explicitados dois aspectos principals do presente trabalho: a Lingulstica de Corpus e os verbos modais. Na primeira subsecao, enfoca-se o significado da palavra 'corpus' para a area do conhecimento na qual este trabalho se insere. Define- se tambem a Lingulstica de Corpus e diferencia-se a mesma da tradicao gerativista. Na segunda subsecao, discorre-se a respeito dos verbos modais e suas diferentes classificacoes em tres gra- maticas da lingua inglesa. Adicionalmente, nesta subsecao, sao revisados estudos baseados em corpora que tratam, de forma dire- ta ou indireta, da utilizacao de verbos modais por aprendizes de ingles como LE e/ou falantes de ingles como LI. 2.1) Lingulstica de Corpus Apesar de haver muitas pesquisas de cunho lingulstico e ate mesmo literario que se utilizam de um corpus (ou corpora), e importante especificar exatamente o que se entende por corpus. Segundo o Novo Aurelio seculo XXI (FERREIRA, 1999, p. 561), a palavra 'corpus7 tern tres acepcoes: (1) "conjunto de docu- mentos, dados e informacoes sobre determinada materia", (2) "toda a obra atribuida a um escritor" e (3) "conjunto finito de materials significantes (enunciados lingulsticos, capas de revis- tas, etc.) constituldo com vistas a analise semiologica". Estes sao sentidos gerais que acabam por nao refletir o significado de tal palavra na area de Lingulstica de Corpus. McEnery e Wilson (1996, p. 21) resumem bem esta divergencia no signi- ficado da palavra em questao: 67 em principio, qualquer colecao de mais de um texto pode ser chamada de corpus: o termo 'corpus* e simplesmente a palavra latina para 'corpo'; um corpus, portanto, pode ser definido como qualquer corpo de texto. [...] Porem, quando utilizado no con- texto da Lingulstica moderna, o termo 'corpus' tende frequentemente a ter conotacoes mais especlficas do que esta definicao oferece.3 Um corpus, portanto, adquire caracterlsticas especlficas no ambito da Lingulstica de Corpus. Reproduzem-se abaixo, em ordem cronologica, algumas definicoes4 para tal conceito na literatura especlfica: a corpus is a collection of naturally-occurring language text, chosen to characterize a state of variety of a language. (SINCLAIR, 1991, p. 171) [a corpus is a] computer readable collection of texts or transcripts which can be accessed and interrogated selectively using text retrieval or concordancing software (ASTON, 1997, p. 205) A collection of spoken and written texts, organized by register and coded for other discourse considerations, comprises a corpus. (BIBER et alii, 1999, p. 4) A corpus can be defined as a collection of texts assumed to be representative of a given language put together so that it can be used for linguistic analysis. (TOGNINI-BONELLI, 2001, p. 2) A corpus is a large, principled collection of naturally-occurring texts that is stored in electronic form (accessible on computer). (CONRAD, 2002, p. 76) 3 Traducao livre do seguinte fragmento: "in principle, any collection of more than one text can be called a corpus: the term 'corpus' is simply the Latin for 'body', hence a corpus may be defined as any body of text. [...] But the term 'corpus' when used in the context of modern linguistics tends most frequently to have more specific connotations than this simple definition provides for". 4 Excepcionalmente nesta parte do trabalho optou-se por manter as citacoes na lingua em que elas foram originariamente escritas (neste caso, a lingua inglesa) para que se mantivesse a ideia original de cada teorico. 68 Ao analisar as cinco definicoes para 'corpus', e posslvel notar a existencia de algumas caractensticas peculiares a tal construto teorico. Para que uma colecao de textos seja considerada um corpus, ela deve conter textos autenticos e naturais, ou seja, estes nao podem ser produzidos por computador e/ou inteligencia artifi- cial, por exemplo. Com relacao a compilacao, a mesma deve ser realizada de forma seletiva e ordenada com um proposito defini- do e especlfico. Quanto ao formato, os textos devem ser leglveis por computador. Por fim, a selecao deve ser representativa do uso lingulstico que se deseja analisar. Um corpus difere de um texto de varias maneiras, como aponta Tognini-Bonelli (2001, p. 2). A leitura do primeiro e fragmenta- da, vertical e tern o objetivo de identificar eventos repetidos que formem padroes. A leitura do segundo, por outro lado, e realizada por inteiro e na direcao horizontal com o objetivo de entender o conteudo do mesmo. Enquanto um corpus e lido como uma re- presentacao de pratica social, um texto e lido como um ato de vontade individual. Deve-se tambem ressaltar que, ao passo que um texto constitui um evento comunicativo coerente, nao se deve esperar da leitura de um corpus a mesma coerencia. Uma vez tendo definido o sentido da palavra 'corpus', pode- se esclarecer o que se entende por Lingulstica de Corpus. Segun- do McEnery e Wilson (1996, p. 1), esta area do conhecimento pode ser descrita como o estudo da linguagem calcada em ins- tancias reais de uso lingulstico. A Lingulstica de Corpus difere dos estudos baseados na tradicao Chomskyana justamente por se apoiar em dados reais. Enquanto a primeira area se ocupa da linguagem em uso e parte dos exemplos para chegar as generali- zacoes, a segunda utiliza a introspeccao como forma de obten- cao de dados, partindo de generalizacoes para comprova-las com exemplos geralmente inventados. Se, por um lado, a Lingulstica de Corpus se interessa em revelar padroes de uso de uma determina- da lingua, o Gerativismo se preocupa em descobrir universais lingulsticos que possam ser aplicados a todas as lfnguas. Em outras 69 palavras, a primeira area tem por foco a probabilidade de uso de um determinado traco lingulstico enquanto a segunda se preocu- pa com a ocorrencia de uma dada categoria em uma determinada posicao. Segundo Sinclair (2003, p. ix), "antes da disponibilizacao de grandes quantidades de dados, muitas das generalizacoes tinham de ser feitas intuitivamente; nao era posslvel verificar nocoes na era anterior a Lingiilstica de Corpus"s. Decorre dai, portanto, que nao ha mais motivos para que se dependa unicamente de intuicoes para a analise lingiilstica, ja que a popularizacao dos computadores hoje em dia permite que um analista investigue corpora extensos em questao de segundos. 2.2) Verbos modais Esta subsecao encontra-se divida em duas partes. Primeira- mente, sao oferecidas descricoes gramaticais para os verbos modais. Em um segundo momento, discorre-se a respeito de es- tudos baseados em corpora que abordam o uso de tais verbos na escrita de aprendizes de lingua inglesa e/ou de falantes de ingles como LI. 2.2.1) Descrigao gramatical Praticamente todas as gramaticas da lingua inglesa incluem um capitulo ou uma secao a respeito dos verbos modais. Tanto gramaticas mais pedagogicas voltadas para o estudante, como a de Swan (1998), quanto gramaticas mais preocupadas com a descricao linguistica, como a de Biber et alii (1999), tratam deste assunto, indicando assim que a modalizacao constitui-se em um aspecto relevante. Swan (1998), por exemplo, descreve os verbos modais de uma forma generalizante. Agrupa Qcan\ 'could, cmay\ imight\ 'will\ 5 Tradu^ao livre do seguinte fragmento: "before large amounts of data were easily available, most of the generalisation had to be done by intuitive guesswork; pre-Corpus Linguistics were not able to check their notions". 70 'would, 'shall, 'should, 'must e 'ought em uma mesma categoria, a saber, Verbos modais auxiliares'. Afkma tambem que 'need, 'dare1 e 'had bettef podem ser empregados como Verbos modais auxiliares', sem que os mesmos sejam diferenciados dos outros verbos modais como 'caff e 'could, por exemplo. Este tratamento de verbos modais pode estar relacionado a proposta do autor de apresentar topicos gramaticais de forma pratica e pouco complicada apesar de seu publico-alvo ser constituldo por professores de ingles, como indi- cado em sua introducao.6 Apesar de ser clara e de possivelmente atender aos anseios de estudantes de lingua inglesa, o tratamento dispensado por Swan a questao dos verbos modais nao se alinha ao objetivo desta investigacao, que invariavelmente exige uma descricao mais detalhada a respeito nao so dos verbos modais propriamente ditos, mas tambem de seus respectivos empregos. Uma abordagem diferente a questao e oferecida pela Collins Cobuild English Gramma? (SINCLAIR, 1990). Esta foi a primeira gramatica da lingua inglesa cuja descricao se baseou na analise de dados reais compilados no corpus de Birmingham. Diferentemente de Swan (1998), Sinclair (1990) propoe que os verbos modais sejam classificados em duas categorias distintas: Verbos modais' e Verbos semi-modais'. Na primeira categoria, sao agrupados 'can\ 'could, 'may, 'might, 'must, 'ought to\ 'shall', 'should, 'wilt e 'would. A segunda categoria engloba 'dare\ 'need e 'used to\ Esta gramatica, contudo, descreve a lingua inglesa de uma forma geral sem fazer distincao entre os diferentes registros que compoem uma determinada lingua. 6 Le-se na introducao a obra de Swan (1998, p. xi): "The book is intended for intermediate and advanced students, and for teachers of English.". Mais adiante quando explicita a abordagem e o estilo da obra, o autor escreve que "explanations are, as far as possible, in simple everyday language. Where it has been necessary to use grammatical terminology, I have generally preferred to use traditional terms that are well known and easy to understand. Some of these terms (e.g. future tense) would be regarded as unsatisfactory by academic grammarians, but I am not writing for specialists". 71 Apesar de seguir a tradicao de Sinclair (1990) e tambem se apoiar em dados reais, a Longman Grammar of Spoken and Written English (BIBER et alii, 1999) apresenta uma abordagem diferen- te. De acordo com esta gramatica, os verbos modais podem ser categorizados em tres grupos, a saber, Verbos modais', Verbos auxiliares marginais' e Verbos semi-modais'. O primeiro grupo possui algumas caracteristicas identificadoras como (a) serem formas invariaveis, (b) precede- rem o sujeito em perguntas que exigem resposta sim ou nao e (c) serem seguidos por um verbo na forma infinitiva sem 'to' (BIBER et alii, 1999, p. 483). Nele estao inseridos 'cat?, 'could, 'may\ 'might, 'shall', 'should, 'will, 'would e 'must. Os verbos auxiliares marginais correspondem a 'need (toj, 'ought to\ 'dare (toj e 'used to\ De acordo com Biber et alii (1999, p. 484), estes verbos sao raros e estao presentes praticamente so- mente no ingles britanico. Ja as expressoes idiomaticas fixas como '(had) better', 'have to\ '(have) got to\ 'be supposed td e 'be going td sao consideradas verbos semi-modais por Biber et alii (1999, p. 484). Eles diferem dos outros grupos por poderem ter marcacao tanto de tempo como de pessoa e por poderem ser utilizados como formas infinitas. Emprega-se neste trabalho a descricao de verbos modais de Biber et alii (1999) uma vez que esta obra de referenda, diferen- temente de Sinclair (1990), considera as caracteristicas gramati- cais de acordo com cada registro analisado, a saber, conversa, ficcao, linguagem jornalfstica e prosa academica. 2.2.2) Estudos baseados em corpora Os nove verbos modais agrupados por Biber et alii (1999) na primeira categoria tambem sao chamados de Verbos modais centrais' em Wilson (2005), que afirma que tais verbos tern sido muito focalizados pelos teoricos devido a sua alta complexidade semantica (WILSON, 2005, p. 151). 72 Um estudo que aborda indiretamente esta questao e o de Mindt (1996), em que o autor argumenta que apesar de a Lin- giilstica de Corpus ja ter influenciado materials de referenda como dicionarios e gramaticas, os livros didaticos para o ensino de in- gles como LE continuam inalterados. Usando uma parte do London-Lund Corpus, ele argumenta que 'would', ccarf e 'will sao os verbos modais mais comuns em seu corpus. Considerando que "as formas presentes ocorrem mais frequentemente em oracoes principals do que as formas passadas"7, (MINDT, 1996, p. 234) e que 'will e um verbo modal extremamente freqiiente em conver- sas em ingles, Mindt (1996) propoe que livros didaticos alemaes de ingles como LE devem introduzir tal verbo modal no primei- ro ano de estudo em vez de faze-lo no segundo. Em outras pala- vras, a apresentacao de 'will nao deve ser adiada em favor de 'must e imay\ que sao verbos modais menos frequentes. O estudo de Ringbom (1998) tambem aborda a questao da utilizacao de verbos modais quando compila as freqiiencias vocabulares na escrita de estudantes de ingles de sete nacionali- dades diferentes (holandesa, fino-sueca, finlandesa, francesa, ale- ma, espanhola e sueca). Os sete subcorpora, partes integrantes do projeto denominado International Corpus of Learner English (ICLE), foram comparados ao Louvain Corpus of Native English Essays (LOCNESS), composto por redacoes argumentativas de estudan- tes americanos e britanicos. Apesar de nao haver uma explicacao completa a respeito das 110 palavras mais frequentes apresenta- das no artigo, podem-se perceber algumas diferencas entre os grupos analisados. Parece que todos os grupos de estudantes uti- Hzam 'cart em demasia e subutilizam 'would e 'will. Uma unica excecao concerne o grupo frances que emprega 'wilt frequentemente. Em relacao ao verbo modal 'should, espanhois, 7 Tradu^ao livre do seguinte fragmento: "the present forms occur more frequently in main clauses than the past forms". 73 fino-suecos, suecos e holandeses geralmente o subutilizam en- quanto alemaes, finlandeses e Franceses tendem a fazer uso do mesmo mais comumente do que americanos e britanicos. Quanto ao verbo modal 'could, ha tres resultados distintos: (a) os estudantes finlandeses lancam mao deste verbo modal da mesma forma que seus pares americanos e britanicos; (b) os alunos espanhois em- pregam-no em maior escala; e (c) todos os outros cinco grupos nacionais subutilizam-no. Em vez de oferecer uma interpretacao completa a respeito dos dados apresentados no artigo, Ringbom (1998, p. 51) conclui que [o] capltulo tentou mostrar como uma aparentemente sim- ples contagem de frequencia de palavras pode oferecer um ponto de partida util para muitos e interessantes projetos de escala menor nos quais as caracteristicas gerais da linguagem do aluno avancado assim como a relativa importancia da transfe- rencia e das caracteristicas universais podem ser exploradas.8 Apesar de os verbos modais ja terem sido estudados por um grande numero de lingiiistas de corpus (cf. WILSON, 2005), pare- ce haver uma lacuna de estudos que enfoquem a producao escri- ta de estudantes brasileiros de ingles como LE. No contexto brasileiro, ha, por exemplo, o estudo de Viana (2006a) acerca da utilizacao de nove verbos modais ('can\ 'could, 'may', 'might, 'shall', 'should, 'mill, 'would e 'musf) na escrita de alunos de nacionalidade brasileira. Para esta finalidade, utiliza-se um corpus de redacoes em lingua inglesa escritas por alunos avancados de ingles como LE, oriundos de cursos livres na Cidade do Rio de Janeiro. O estudo compara a producao escrita destes aprendizes 8 Tradu^ao livre do seguinte fragmento: "chapter has tried to show that a seemingly simple word frequency count may provide a useful starting point for many interesting small-scale projects where the general characteristics of advanced learner language as well as the relative importance of transfer and universal features can be further explored". 74 a producao escrita de falantes de ingles como LI. Os resultados sugerem que os sujeitos de pesquisa utilizam em demasia verbos modais que indicam volicao ou predicao9, espedalmente cwilt. Aponta-se tambem a subutilizacao de verbos modais em sintagmas verbais na voz passiva. O estudo conclui que a escrita dos sujei- tos investigados se aproxima da producao oral de falantes de in- gles como LI, o que contraria as expectativas iniciais, ja que os mesmos estao prestes a concluir seus estudos. Este trabalho pretende dar continuidade a pesquisa de Viana (2006a) ao analisar a escrita de uma populacao diferente. Dei- xam-se de lado os estudantes de ingles de cursos livres para in- vestigar pesquisadores brasileiros, que, como se acredita, devem ser proficientes em lingua inglesa. Assim sendo, espera-se que os resultados encontrados sejam semelhantes a prosa academica descrita por Biber et alii (1999) e, contrariamente, distintos dos resultados encontrados por Viana (2006a). 3) Metodologia Dado que o presente estudo tern como objetivo mapear a utilizacao de verbos modais na prosa academica em lingua inglesa de pesquisadores brasileiros, foi necessario compilar um corpus de estudo que representasse tal uso lingulstico. Para tanto, decidiu-se coletar artigos cientlficos publicados em periodicos especializados e anais de eventos disponlveis em meio eletronico. Como o material foi obtido na internet, nao foi preciso digitar ou digitalizar os artigos que foram incluldos no corpus. No entanto, alguns criterios de formatacao tiveram que ser estabelecidos para que os textos pudessem ser convertidos em arquivos TXT (texto sem formatacao) e, desta forma, lidos pela ferramenta computacional. 9 Apesar deste emprego, Viana (2006a) ressalta que nao ha nenhuma instancia de 'shall no corpus por ele investigado. 75 Decidiu-se, entao, pela manutencao de titulos, subtltulos e citacoes curtas. As citacoes curtas sao aquelas que estao integra- das ao corpo do texto, ou seja, aquelas que ocupam menos de tres linhas de acordo com as normas da ABNT. Por outro lado, foram excluldos resumos, palavras-chaves, citacoes longas, notas (de rodape ou de fim), quaisquer tipos de elementos graficos e referencias bibliograficas. Os resumos fo- ram desconsiderados porque eles podem ser tratados como um genero distinto. As palavras-chave foram descartadas por nao contribulrem para o estudo em tela. As citacoes longas - ou seja, aquelas destacadas do paragrafo — foram excluldas porque elas representam vozes de outras pessoas que nao a dos autores do artigo na maioria dos casos. Apesar de se ter certeza de que os autores dos artigos eram brasileiros, tal assercao nao poderia ser feita no caso das citacoes. Entao, de forma a evitar que a produ- cao escrita de uma pessoa de nacionalidade nao-brasileira fos- se inclulda na analise, optou-se por excluir tais citacoes. Ape- sar de as notas de rodape ou de fim serem produtos da escrita de pesquisadores brasileiros, elas tiveram de ser suprimidas, ja que o programa computacional nao leria corretamente os nu- meros sobrescritos que indicam tais notas. Ou o programa leria 'palavral', o que seria diferente de 'palavra', ou 'palavra 1', o que acabaria por gerar a inclusao de um item lexical (o numero '1') na contagem final de palavras. Igualmente por causa da limitacao do formato TXT, foram excluldas tabelas, figuras, ilustracoes e graficos de todos os artigos. Por fim, foi deixada de fora do corpus a secao de referencias bibliograficas, indispensavel dentro do genero artigo cientlfico; porem, des- necessaria para o presente estudo. Ao todo, ha no corpus 49 artigos cientlficos escritos em lingua inglesa por 50 pesquisadores10 brasileiros das areas de Um artigo que integra o corpus foi escrito por dois pesquisadores conjuntamente. 76 Lingiilstica e Literatura. Os artigos foram coletados em 11 fon- tes distintas disponlveis em meio digital. O corpus contem 208.614 kens11 e 12.791 formas12. A metodologia envolveu a utilizacao de um programa de analise textual chamado WordSmith Tools (SCOTT, 1999), que contempla tres ferramentas: WordUst, Concorde KeyWords. A fer- ramenta WordUst fornece listas de palavras existentes em um dado corpus em ordem de freqiiencia ou alfabetica. Esta mesma ferramenta tambem gera dados especlficos a respeito da cole- cao de textos investigada como o numero de formas, itens, pa- ragrafos, entre outros. O Concord, por sua vez, compila linhas de concordancia que, segundo Conrad (2002, p. 75), "exibem todas as ocorrencias de uma palavra ou estrutura em uma base de dados com uma pequena quantidade de contexto13 em cada lado"14. Finalmente, a ferramenta KeyWords e empregada para comparar duas listas de palavras com vistas a verificacao do que e caracteristico de um corpus de pesquisa quando compara- do a um corpus de referenda. 11A palavra 'item' refere-se a cada palavra no corpus. Utiliza-se tambem a palavra 'ocorrencia' neste sentido. 12 Refere-se aqui ao numero de palavras distintas existentes no corpus. Na literatura especlfica, pode-se encontrar a palavra 'vocabulo' como sinonimo para este termo. 13 Apesar de Conrad (2002, p. 75) utilizar a palavra 'contexto' (^context no original em ingles), opta-se no escopo deste trabalho pela utilizacao da palavra 'cotexto' para se referir ao mesmo fenomeno. Sinclair (2003, p. 174) define 'cotexto' como um grupo de palavras que ocorre em ambos os lados de uma determinada palavra de busca em um texto. Desta forma, tem-se que 'cotexto' e utilizado para se referir ao ambiente lingulstico no qual uma palavra ou expressao esta inserida enquanto 'contexto' e utilizado para se referir as restricoes situacionais e/ou culturais como advogado pela Lingiilstica Sistemico-Funcional. 14 Traducao livre do seguinte fragmento: "These listings display all the occurrences of a word or structure in a database, with a small amount of context on each side". 77 Para a presente pesquisa, utilizaram-se duas ferramentas em especial: WordUsl e Concord. Com a primeira, foi posslvel listar os verbos modais mais freqiientes no corpus de pesquisa.15 Esta listagem pode ser ordenada de acordo com criterios alfabetico ou de frequencia, como ilustra a Figura 1. .r.lii |.>rw_--,idli "IE i n 1 fit- .JVIi^ Gwmmbi hL ViTUti H' o i .. ■ ■ 3 £ i- *a I] ^^^^ Ij-l.. MAT □.lfl WILL 0.15 390 ■j 'J wcQdn|1>rwaJd D li tfqtfdhtf :oui_b 1st 009 CftJdnM) lie 0.07 ICS a-wx Figura 1: Tela do WordUst (ordem de frequencia) Em uma mesma linha, alem do verbo modal, ha tambem informacao a respeito da frequencia do mesmo em termos absoluto e percentual, bem como os lemas de tal verbo. A titulo de exemplificacao, pode-se citar o primeiro item na Fi- gura 1. O verbo 'cart ocorreu 626 vezes, o que representa 0,30% de todos os itens existentes no corpus. Destas 626 ocorrencias, 105 sao deste verbo na forma negativa por extenso ('cannof) e 521 sao do verbo na forma afirmativa ('can') ou na forma ne- gativa reduzida ('can't). 15 A selecao dos verbos modais foi feita manualmente nesta pesquisa dado que se trabalha somente com um numero reduzido de formas. 78 Em um segundo momento, utilizou-se a ferramenta Concord para investigar os ambientes lexicais nos quais os verbos modais estavam inseridos. IB-ThIkimI |CAr<iJiJLIM[lh S-J-l .....ht |hM 1IUII..WH f rk Up Utadw r ^ >wim |i Qilf ■■■ „ ^ ■ ■ ■ "jt 0 ^ _J wne panpherd pcoubi il • i ■■ bo Mid Ihd! such n iki 1 lei ert language* Frflfliy. It can be mu Uia, despite di 1 i^ing raflUfldons-, *k , rtficfi t an be said to 'French," H fi9 not Wbtr- tful Ite ^Eul5 C in be 53HI tCi t>* 3HOCK3te til 1 pined RvidancD tiij q-rdis ■ n be SHtjra|id!iy dnrund — Ml 'I bkU^'jTT prMIIOLtz [« l^S'itd. Old IllbCflOUl 1 r- thai no tatesflal body diet =' be Men **di tt^e naked 1 h, me propel reported here >: n be »an a& ndino in a i 1. SB*nsn Rij&hdiG'S "foncH1 C-Sn be MRnflS imrwrsBdi 1 rianr-^iG^or'Q "yir.aijdicrrE, r .xi b* Hon inrnrruphnrn J VVhlfl thii BHompk l an be »rn » srnpksbc. Imeni towards, due rastfidion c*i be aefcn dl d«s pura itv _H I iJl Figura 2: Tela do Concord ('can' como palavra de busca) E atraves desta ferramenta que se torna posslvel no tar os padroes de utilizacao dos verbos modais. No caso da selecao fei- ta na Figura 2, pode-se perceber que todas as instancias de 'cart sao seguidas do verbo 'to hi e de um verbo no particlpio passado, caracterizando assim o uso da voz passiva nas treze linhas de concordancia exibidas. Os dados observados na escrita de pesquisadores brasileiros foram contrastados a descricao presente na Longman Grammar of Spoken and Written English (BIBER et alii, 1999). Os autores desta gramatica analisaram o Longman Spoken and Written English Corpus de forma a descrever "o uso real de caracteristicas gramaticais em diferentes variedades do ingles: principalmente em conversa, 79 ficcao, linguagem jornalfstica e prosa academica"16 (BIBER et alii, 1999, p. 4). Na presente pesquisa, optou-se pela comparacao dos dados analisados com o registro 'prosa academica' descrito na gramatica supracitada. 4) Analise de dados Como anteriormente explicitado, o escopo deste trabalho consiste na investigacao de 'caff, ''could, 'may,'might', 'shall,''should', 'will, ''would e 'must, denominados de Verbos modais' por Biber et alii (1999), na escrita academica de pesquisadores brasileiros das areas de Lingulstica e Literatura. Estes verbos podem ser agrupados de duas formas: (a) pela referenda temporal que podem fazer e (b) pela ideia que eles transmitem. Em relacao a referenda temporal, os verbos modais podem ser classificados em dois grupos: os que nao se referem ao passado e os que podem fazer tal referenda. Encontram-se, no primeiro grupo, 'maff, 'caff, 'will e 'shall; enquanto 'might, 'could', 'would e 'should estao no segundo. A diferenca de uso destes dois grupos e grande, como ilustra a Tabela 1. Tabela 1: Distribuicao de verbos modais no corpus de pesquisa (referenda temporal) Referenda outra que r, lao ao passado Vossivel referenda ao passado Total Verbo modal Porcentagem Verbo modal Porcentagem 'May' 78,86% 'Might' 21,14% 100% 'Can' 77,00% 'Could' 23,00% 100% wur 51,42% Would' 48,58% 100% 'Shall' 2,59% 'Should' 97,41% 100% 16 Traducao livre do seguinte fragmento: "describes the actual use of grammatical features in different varieties of English: mainly conversation, fiction, newspaper language, and academic prose". 80 Verifica-se que os dois primeiros verbos que nao podem fa- zer referenda ao passado ('may' e 'can*) sao aproximadamente tres vezes mais freqiientes que seus pares ('mighf e 'could, respectiva- mente). No caso do par 'will e "would', o primeiro tambem e mais freqiiente; porem, a diferenca percentual de uso entre ambos e bastante reduzida. Ha uma distribuicao quase uniforme ja que o primeiro ocorre 51,42% no corpus e o segundo, 48,58%. Contu- do, e na analise do par 'shall e 'should que se pode notar uma discrepancia na utilizacao dos mesmos com 'should sendo muito mais freqiiente do que 'shall. Na verdade, o verbo 'shall mostra- se extremamente infreqiiente, ocorrendo apenas 2,59% no corpus de pesquisa. Os resultados para a prosa academica de brasileiros e seme- lhante aos reportados por Biber et alii (1999, p. 486). Segundo estes pesquisadores, "o verbo que pode expressar tempo passa- do e menos freqiiente do que o seu par em todos os casos com excecao de shall/should'11. Tambem se registra na gramatica que 'shall e raramente utilizado nos artigos cientlficos escritos por falantes de ingles como LI. Em relacao as ideias, os verbos modais podem ser classifica- dos em tres grupos (cf. BIBER et al., 1999, p. 489): (a) permis- sao, possibilidade ou habilidade ('caff, 'could', 'may' e 'might), (b) volicao ou predi^ao ('will, 'would e 'shall), e (c) necessidade ou obrigacao (^should e 'must). A Tabela 2 indica as freqiiencias ab- solutas de cada um dos verbos modais por grupo. 17 Tradu^ao livre do seguinte fragmento: "the tentative/past time member is less frequent that its partner in all cases except shall/should 81 Tabela 2: Distribuicao de verbos modais no corpus de pesquisa (ideias) Ideias Verbos modais Ocorrencias Permissao 'can' 626 Possibilidade 'could' 187 Habilidade 'may' 403 'might' 108 Volicao 'will' 307 Predicao 'would' 290 'shall' 7 Necessidade 'should' 263 Obrigacao 'must' 146 O uso de verbos da cada grupo semantico e representado no Grafico 1. □ Permissao / Possibilidade / Habilidade □ Volicao / Predicao □ Necessidade / Obrigacao Corpus de aprendiz Grafico 1: Emprego de verbos modais por grupo semantico Uma vez verificada a distribuicao dos nove verbos modais no corpus de estudo, pode-se comparar os resultados do Grafico 1 ao mapeamento de verbos modais no registro prosa academica 82 realizado por Biber et alii (1999, p. 489). Os pesquisadores bra- sileiros das areas de Lingulstica e Literatura tendem a utilizar verbos modais na mesma proporcao que seus pares, falantes de ingles como LI. Em outras palavras, ha um grande emprego de verbos modais que indicam permissao, possibilidade ou habili- dade com mais de 50% das instancias. Com mais de 25% das instancias, tem-se verbos que indicam volicao ou predicao. O grupo menos freqiiente na escrita de ambos os grupos de sujei- tos e aquele que indica necessidade ou obrigacao. Uma outra caracteristica da prosa academica em lingua in- glesa de acordo com Biber et alii (1999) concerne o emprego de verbos modais na voz passiva. Como eles afirmam, a voz passiva com tais verbos e rara em conversa e ficcao, mas e relativamente comum para alguns destes verbos na prosa academica (BIBER et alii, 1999, p. 499). No corpus de aprendiz, apesar de os sintagmas verbais que contenham verbos modais estarem majoritariamente na voz ati- va, ha certa recorrencia da voz passiva, o que nao foi registrado na pesquisa de Viana (2006a) com relacao a escrita de alunos de cursos livres, por exemplo. 83 shall n might □ would □ will T-ijj.I [J may □ can Voz ativa Voe pas-siva Grafico 2: Distribuicao de verbos modais (vozes ativa e passiva) O Grafico 2 indica que pelo menos 10% de cada um dos verbos modais sao empregados na voz passiva. A unica excecao registrada concerne o emprego de 'shall', que sempre ocorre na voz ativa. Este resultado, contudo, pode ter sido influenciado pelo tamanho do corpus de estudo, caracterizado como pequeno por conter apenas 208.614 kens. O resultado aqui apresentado difere sobremaneira dos re- sultados encontrados por Viana (2006a). Se os verbos modais sao utilizados no mlnimo 10% na voz passiva na prosa academi- ca de brasileiros, somente 'must e 'should eram empregados mais de 10% em sintagmas verbais na voz passiva na escrita de alunos de cursos livres. Deve-se ressaltar tambem que 'could e 'should ocorrem mais de 30% na voz passiva: 35,83% no caso do primei- ro e 36,12% no segundo caso. Por fim, nota-se tambem que um verbo modal - 'caff — foi empregado com distribuicao semelhan- te entre as vozes ativa e passiva. Enquanto 54,63% das instancias de 'cad foram empregadas na voz ativa, 45,37% das ocorrencias do mesmo se deram na voz passiva. 84 Os resultados encontrados na investigate) do corpus de apren- diz sao semelhantes aos reportados por Biber et alii (1999). Os pesquisadores afirmam que "com a passiva, can e should sao parti- cularmente comuns, could e must tambem sao razoavelmente co- muns"18. Foram exatamente estes quatro verbos os mais freqiientemente utilizados na passiva. A unica diferenca concerne o emprego mais recorrente de 'may' na voz passiva do que o de 'must. Contudo, a diferenca e reduzida: o primeiro ocorre na voz passiva em 25,31% ao passo que o segundo e empregado em 23,97% das vezes. 5) Conclusoes Os resultados deste estudo indicam que os pesquisadores brasileiros das areas de Lingulstica e Literatura cuja escrita foi aqui estudada utilizam verbos modais de forma semelhante a prosa academica de falantes de ingles como LI (cf. BIBER et alii, 1999). Quando os verbos modais sao analisados sob o ponto de vista da referenda temporal, verifica-se que os verbos que nao fazem re- ferenda ao passado (imay\ ccati e em/F) sao mais freqiientes que seus pares. A unica excecao consiste na utilizacao em larga escala de 'should (com posslvel referenda ao passado) em comparacao ao verbo modal 'shall. Com relacao ao significado, a presenca de verbos modais em ambos os corpora e similar: verbos que deno- tam permissao, possibilidade ou habilidade sao os mais freqiien- tes, os que indicam volicao ou predicao ficam em segundo lugar e aqueles que indicam necessidade ou obrigacao aparecem em ultimo lugar. Tambem foi verificado que os verbos modais sao empregados na voz passiva em mais de 10% das instancias em quase todos os casos. A unica excecao diz respeito ao verbo modal 18 Tradu^ao livre do seguinte fragmento: "with the passive, can and should are particularly common, could and must 85 'shall, que aparece de forma muito pouco freqiiente no corpus de pesquisa. Ressalta-se, porem, a distribuicao semelhante de 'cart nas vozes ativa e passiva. Ao mapear a escrita de alunos avancados de cursos livres na Cidade do Rio de Janeiro, Viana (2006a) concluiu que estes sujei- tos diferem de falantes de ingles como LI com relacao ao empre- go de verbos modais. Por outro lado, o presente trabalho tracou um panorama distinto ao mapear a escrita de pesquisadores bra- sileiros das areas de Lingulstica e Literatura. Enquanto os sujei- tos anteriormente investigados marcavam em suas redacoes o uso equivocado de verbos modais, a producao dos sujeitos ora analisada indica que a utilizacao de verbos modais e compatlvel com a de falantes de ingles como LI. O presente estudo confirma a conclusao de Viana (2006b), que mapeou o mesmo corpus de pesquisa, mas utilizou uma outra unidade de analise, a saber, os feixes lexicais. Naquele estudo, Viana (2006b) apontou a proficiencia dos sujeitos de pesquisa como posslvel conclusao para a semelhanca de estruturas e fun- coes dos feixes investigados. A partir do mesmo corpus, aqui se conclui que esta producao escrita tambem se assemelha a descri- cao gramatical da lingua inglesa como LI mesmo quando a uni- dade analftica e o verbo modal. Se, por um lado, a escrita de alunos de cursos livres se dis- tancia da escrita em ingles como LI e, por outro, a escrita de pesquisadores brasileiros se aproxima da mesma, resta ainda in- vestigar populacoes que possivelmente se encontram em outros estagios de proficiencia. Um encaminhamento para esta pesquisa e verificar como os verbos modais sao utilizados em redacoes produzidas por alunos universitarios. A duvida a ser esclarecida neste caso e se estes alunos ja sao capazes de utilizar verbos modais tais como os falantes de ingles como LI o fazem ou se este em- prego pode ser caracterizado como um estagio intermediario entre as duas populacoes ja investigadas. 86 6) Referencias bibliograficas ASTON, G. Involving learners in developing learning methods: exploiting text corpora in self-access. In: BENSON, P.; VOLLER, P. (Eds.). Autonomy and independence in language learning Harlow: Longman, 1997. p. 204-214. BERBER SARDINHA, A. P. LingMstica de Corpus. Sao Paulo: Manole, 2004. BIBER, D. et alii. Longman grammar of spoken and written English. London: Longman, 1999. BIBER, D.; CONRAD, S.; CORTES, V. If you look at...: lexical bundles in university teaching and textbooks. Applied Linguistics, 25, 3, p. 371-405, 2004. CONRAD, S. Corpus linguistic approaches for discourse analysis. Annual Review of Applied Linguistics, 22, p. 75-95, 2002. FERREIRA, A. B. de H. Novo Aurelio seculo XXI: o diciondrio da linguaportuguesa. 3. ed. Rio de Janeiro: Nova Fronteira, 1999. HUSTON, S. Corpora in Applied Linguistics. Cambridge: Cambridge University Press, 2002. MCENERY, T; WILSON, A. Corpus Linguistics. Edinburgh: Edinburgh University Press, 1996. MINDT, D. English Corpus Linguistics and the foreign language teaching syllabus. In: THOMAS, J.; SHORT, M. (Eds.). Using corpora for language research. London/New York: Longman, 1996. p. 232-247. RINGBOM, H. Vocabulary frequencies in advanced learner English: a cross-linguistic approach. In: GRANGER, S. (Ed.). Learner English on computer. London/New York: Longman, 1998. p. 41- 52. SCOTT, M. WordSmith tools3.0. Oxford: Oxford University Press, 1999. SINCLAIR, J. (Ed.). Collins Cobuild English grammar. London/ Glasgow: Collins, 1990. _. Corpus, concordance, collocation. Oxford: Oxford University Press, 1991. 87 _. Reading concordances: an introduction. London: Longman, 2003. SWAN, M. Practical English usage. Oxford: Oxford University Press, 1998. TOGNINI-BONELLI, E. Corpus Linguistics at work. Amsterdan/ Philadelphia: John Benjamins Company, 2001. VIANA, V. P. Modals in Brazilian advanced EFL learners' compositions: a corpus-based investigation. Profile: Issues in Teachers Professional Development, 7, p. 77-86, 2006a. VIANA, V. P. On the other hand: a escrita academica de pesqui- sadores brasileiros em lingua inglesa. In: ZYNGIER, S.; VIANA, V; SPALLAN2ANI, A. M. (Ed.). Unguagens e tecnologias: estudos empiricos. Rio de Janeiro: Publit Solucoes Editorials, 2006b. p. 263-287. WILSON, A. Modal verbs in written Indian English: a quantitative and comparative analysis of the Kolhapur corpus using correspondence analysis. ICAME Journal, 29, p. 151-169, abr. 2005. Disponlvel em: <http://gandalf.aksis.uib.no/icame/ ij29/ij29-pagel51-170.pdf>. Acesso em: 30 jun. 2006. 88
x

Log In

or reset password

Reset Password

Enter the email address you signed up with, and we'll send a reset password email to that address

Academia © 2012