Questo studio offre un’analisi teorica ed un’indagine pratica per lo studio della lingua russa contemporanea su Internet. Il primo capitolo tratta della linguistica dei corpora, dalle sue origini ad oggi, e degli approcci alla disciplina corpus-based e corpus-driven. In seguito, vengono descritti gli sviluppi diacronici della linguistica dei corpora in area anglofona, in Italia e in Russia. Il secondo capitolo riguarda i corpora linguistici tradizionali: oltre alle numerose definizioni di corpus linguistico proposte dai principali autori, vengono illustrate le caratteristiche essenziali dei corpora, quali formato elettronico ed autenticità dei dati, rappresentatività, bilanciamento del corpus, nonché le varie tipologie di corpora linguistici. Il terzo capitolo si focalizza sul Web as Corpus, fornendo una descrizione di questo approccio innovativo e controverso e delle principali critiche mosse nei confronti di questo approccio. Successivamente viene illustrato l’approccio Web for Corpus e le modalità di creazione dei cosiddetti Web Corpora. Il terzo capitolo si conclude con l’analisi di due problematiche relative ai Web corpora, il copyright e il netspeak, la lingua di Internet. Il quarto ed ultimo capitolo presenta l’analisi pratica svolta su oltre 80 lessemi del netspeak russo contemporaneo e realizzata mediante il Corpus Nazionale della Lingua Russa e due Web Corpora, il RuTenTen11 e il RuTenTen17. A conclusione della ricerca vengono illustrati i risultati ottenuti.

Linguistica dei corpora e corpora linguistici: analisi teorica ed indagine pratica per lo studio della lingua russa contemporanea di Internet

Longo, Federica
2022/2023

Abstract

Questo studio offre un’analisi teorica ed un’indagine pratica per lo studio della lingua russa contemporanea su Internet. Il primo capitolo tratta della linguistica dei corpora, dalle sue origini ad oggi, e degli approcci alla disciplina corpus-based e corpus-driven. In seguito, vengono descritti gli sviluppi diacronici della linguistica dei corpora in area anglofona, in Italia e in Russia. Il secondo capitolo riguarda i corpora linguistici tradizionali: oltre alle numerose definizioni di corpus linguistico proposte dai principali autori, vengono illustrate le caratteristiche essenziali dei corpora, quali formato elettronico ed autenticità dei dati, rappresentatività, bilanciamento del corpus, nonché le varie tipologie di corpora linguistici. Il terzo capitolo si focalizza sul Web as Corpus, fornendo una descrizione di questo approccio innovativo e controverso e delle principali critiche mosse nei confronti di questo approccio. Successivamente viene illustrato l’approccio Web for Corpus e le modalità di creazione dei cosiddetti Web Corpora. Il terzo capitolo si conclude con l’analisi di due problematiche relative ai Web corpora, il copyright e il netspeak, la lingua di Internet. Il quarto ed ultimo capitolo presenta l’analisi pratica svolta su oltre 80 lessemi del netspeak russo contemporaneo e realizzata mediante il Corpus Nazionale della Lingua Russa e due Web Corpora, il RuTenTen11 e il RuTenTen17. A conclusione della ricerca vengono illustrati i risultati ottenuti.
File in questo prodotto:
File Dimensione Formato  
882140-1256560.pdf

accesso aperto

Tipologia: Altro materiale allegato
Dimensione 2.61 MB
Formato Adobe PDF
2.61 MB Adobe PDF Visualizza/Apri

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14247/10213