On Github hrmJ / quantling
Härme 2014 (manually annotated):
Russian-Finnish parallel corpus*: 535,095 + 569,960 tokens
Finnish-Russian parallel corpus : 774,061 + 895,556 tokens
* The size of the subcorpus temporarily limited
Clause-initial and clause-final TME by percent
Clause-initial and clause-final TME by count
Kesällä
summer-ADE
rannalla
beach-ADE
leikki
play-IMPERF
lapsia
children
Летом
summer-INS
на
at
берегу
beach-PREP
играли
play-PRET
дети
children
На
-
другой
next
день
day
в
at
двенадцатом
twelweth-PREP
часу
hour-PREP
утра
morning-GEN
гробовщик
undertaker
и
and
его
his
дочери
daughters
вышли
go-PRET
из
through
калитки
gate
Seuraavana
next
päivänä
day-ESS
kello
clock
kaksitoista
twelve
hautausurakoitsija
undertaker
ja
and
hänen
his
tyttärensä
daughters
lähtivät
leave-IMPERF
portista
gate-ELA
Eilen
yesterday
vasta
PRT
rankasti
heavily
satoi
rain-IMPERF
Только
only
после
after
смерти
death-GEN
Мао
M.-GEN
и
and
ареста
arrest-GEN
его
his
жены
wife
Дэн
D.
получил
receive-PRET
возможность
chance-ACC
реализовать
fulfil
свою
his
мечту
dream-ACC
о
about
преобразовании
reform-PREP
Китая
China-GEN
который
that-ACC
летом
summer-INSTR
они
they
используют
use
на
at
даче,
dacha
а
and
на
for
<зиму>
winter
забирают
take
в
to
город
city
jota
that-PART
he
that-PART
käyttivät
use
kesäisin
summer-ADE
maalla,
countryside-ADE
mutta
but
tuovat
bring
talveksi
winter-TRANS
kaupunkiin
city-ILL
два
two
<часа>
hours
подряд
succesively
пейте
drink-IMP
что-нибудь
something-ACC
крепкое
strong-ACC
juokaa
drink-IMP
kaksi
two
tuntia
hours
yhtä
-
päätä
without break
jotakin
something-PART
väkevää
strong-PART
Двадцать
twenty
четыре
four
часа
hour-GEN
в
in
сутки
day
они
they
держат
keep
руку
hand
на
on
пульсе
pulse
вашей
your-GEN
жизни.
life-GEN
He
They
pitävät
keep
kättään
hand-PART
pulssillanne
pulse-ADE
kaksikymmentäneljä
twenty-four
tuntia
hours
vuorokaudessa.
day-INE
утром
morning-INSTR
ты
you
не
NEG
пошел
go-IMPERF
на
to
свою
your-ACC
учебу
class-ACC
sinä
you
et
NEG
mennyt
go-PERF
aamulla
morning-ADE
tunnille
class-ALL
En
NEG
saanut
get-PERF
unta
sleep
koko
whole
yönä.
night-ESS
Всю
whole-ACC
ночь
night-ACC
я
I
не
NEG
мог
can-PRET
заснуть.
fall asleep
Hakulinen, Auli ja Fred Karlsson 1979: Nykysuomen lauseoppia. Hki: Suomalaisen kirjallisuuden seura.
Haverinen, Katri, Jenna Nyblom, Timo Viljanen, Veronika Laippala, Samuel Kohonen, Anna Missilä, … Filip Ginter 2013: Building the essential resources for finnish: the turku dependency treebank Language Resources and Evaluation, 1–39. doi:http://dx.doi.org/10.1007/s10579-013-9244-1
Härme, Juho 2014: Koskeeko kääntäjä sanajärjestykseen? suomen ja venäjän ajanilmaukset esimerkkinä MikaEL, Kääntämisen ja tulkkauksen tutkimuksen symposiumin verkkojulkaisu 2014. http://www.sktl.fi/liitto/seminaarit/mikael-verkkojulkaisu/mikael-vol-8-2014/
Janko, Tatjana 2001: Kommunikativnyje strategii russkoi retši. Moskva: Jazyki slavjanskoj kul’tury.
Kovtunova, Irina 2002[1976]: Sovremennyj russkij jazyk. porjadok slov i aktual’noe chlenenie predlozhenija. Moskva: Prosveshenie.
Sharoff, Serge ja Joakim Nivre 2011: The proper place of men and machines in language technology: processing russian without any linguistic knowledge Komputernaja lingvistika i intellektual’nye tekhnologii: Po materialam Mezhdunarodnoj konferencii ”Dialog”(Bekasovo, 25-29 maja 2011), 591–604. http://corpus.leeds.ac.uk/serge/publications/2011-dialog.pdf
Vilkuna, Maria 1989: Free word order in finnish: its syntax and discourse functions. Hki: Suomalaisen Kirjallisuuden Seura. Hakulinen, Auli ja Fred Karlsson 1979: Nykysuomen lauseoppia. Hki: Suomalaisen kirjallisuuden seura.
Yokoyama, Olga T. 1986: Discourse and word order. Amsterdam: Benjamin.
Presentation made with knitr + slidify + pandoc