Instuderingsfrågor - Talperception
Vilken är energin för talet? Vad händer med den i larynx och i talröret (inklusive näshålan)?
Luften i lungorna som hackas sönder i larynx till följd av bl a bernoullieffekten och filtreras sedan av resonanser i talröret.
Varför låter den egna rösten annorlunda på band?
Det egna talet filtreras på sin väg från munnen till örat dels genom skallbenet och dels genom luften i vinkel bakåt. Båda dessa vägar gynnar låga frekvenser varför en inspelning av den egna rösten låter gällare.
Varför har IPA-tablån en svart markering i rutan för (a) glottal, tonande klusil, samt för (b) faryngal, tonande nasal?
De är anatomiskt omöjliga att producera. (a) samma ställe för fonation och tillslutning, (b) ingen luft kommer ut genom näsan om farynx spärras av.
Varför är de flesta obstruenter tonlösa?
Det beror på tryckfallet – det kräver mer av talaren att hålla det subglottala trycket högre än det orala.
Vilka är de akustiska korrelaten till de auditiva egenskaperna tonhöjd och ljudstyrka?
- Tonhöjd – F0
- Ljudstyrka – intensitet (frekvens, duration)
Vad menas med VOT? Vilka ljud urskiljer detta mått?
Voice Onset Time, röstansatstid, stämläpparnas igångsättning i förhållande till klusilernas explosion
Vilka tre artikulatoriska dimensioner ingår i vokalfyrkanten?
Palatal, faryngal, velar
Vad är det för skillnader mellan svenskans ordaccenter och fokusaccenten?
Ordaccentfallet kommer före fokusaccentstigningen
I svenskan och engelskan innehåller de initiala klusilerna ofta ingen voice bar. Trots detta råder en kontrast mellan tälta och delta. Hur förklarar du detta dilemma?
De skiljer sig åt genom aspiration.
- tälta
- delta
Vilket artikulatoriskt drag har klusiler, nasaler, lateraler och vibranter gemensamt?
De bildas med förträngning.
Vad menas med redundans i talsignalen? Hur uppstår den?
Överskott av information i talsignalen uppkommer genom koartikulation.
Kommentera följande påstående: Det är omöjligt att segmentera talsignalen.
Tal är kontextbundet och varje givet segment i en given tid lämnar spår både i föregående och efterföljande segment.
Vad är den akustiska skillnaden mellan vokaler och konsonanter?
Vokaler är starkare, har högre intensitet, än konsonanter.
Nasaler har en kraftig energikoncentration vid de lägsta frekvenserna. Varför?
Den nasala sidohåligheten bidrar till att göra talröret längre och större vilket gynnar låga frekvenser, nasalformanter, eller nasalt mummel.
Vilka akustiska drag skiljer svenskans bägge klusiler i medial position åt?
Skillnader i ocklusionens duration och transientens intensitet. /p,t,k/ har längre ocklusionsfas och produceras med högre oralt tryck vilket bidrar till transientens högre intensitet. Eventuell ”voice bar” (med varierande längd) på tonande klusiler.
Frikativorna delas in i två huvudkategorier. Vilka? Vilket är det akustiska kriteriet?
Sibilanter och icke-sibilanter. Brusets intensitet, brantare lutning i sibilanternas envelopp.
I språk som t ex engelskan, franskan och tyskan finns en kontrast mellan tonlösa och tonande frikativor - /s/ - /z/. Ofta produceras dock /z/ utan stämläppssvängninar. Vilka akustiska drag kan då överta att signalera kontrasten?
Brusdurationen är längre hos tonlösa frikativor. Även då en tonande frikativa /z/ produceras utan stämläppssvängningar är friktionen kortare än för motsvarande tonlös frikativa. I engelskan är även föregående vokals duration längre för tonande frikativor.
Beskriv en affrikata artikulatoriskt och nämn motsvarande akustiska korrelat.
- Artikulatoriskt: ocklusionsfas, explosionsfas, friktionsfas (förträngning)
- Akustiskt: tystnad, transient, frikativt brus
Vilka tre typer av motorteorier finns. Beskriv en av dem kortfattat.
- Analysis-by-Synthesis (Stevens & Halle: MIT)
- Lyssnaren tar emot ett auditoriskt mönster och analyserar det genom att utlösa en auditorisk modell av hur han själv skulle producera det. Alltså vi hör de ljud som andra bildar i termer av hur vår egen talapparat skulle ha producerat dem.
- Motor Theory of Speech Perception (Liberman et al: Haskins Laboratories)
- Action Theory (Fowler et al)
Vad är orsaken till att man inte har hittat labio-dentala klusiler i något språk?
Ingen fullständig tillslutning, luft läcker ut, bakomliggande tryck kan inte byggas upp.
Vilken ljudklass har de flesta artikulationsställen och dessutom alltid en kontrast mellan tonlösa och tonande? Varför?
Frikativor. Artikulatoriskt sett går det att skapa förträngning mellan alla strukturer i talröret. Frikativornas kontinuitet gör att de
Karakterisera återkopplingsmekanismerna kortfattat.
- Auditiv feedback - när man talar och lyssnar samtidigt: återkopplingen är både luft- och benburen
- Taktil feedback – ytkänsel, återkoppling via beröringsreceptorer i artikulatorerna
- Proprioceptorisk feedback – djupkänsel; kinestetisk återkoppling, omedelbar kompensation av störningar; återkoppling via t ex muskelspolar, och receptorer i leder och senor.
- Intern feedback – förprogrammerade inlärda mönster i hjärna och nervsystem; informationsförmedling i hjärnan om motorkommandon före själva muskelreaktionen.
Vilken kritik kan man rikta mot lingvistiskt orienterade talspråksmodeller?
Lingvistiska modeller har sin utgångspunkt i språkliga enheter såsom fonem, allofoner och distinktiva särdrag. Dessa är till sin natur statiska, vilket leder till att det är svårt att göra den kontextbundna dynamiken rättvisa. Dessutom är beskrivningen av de olika enheterna vare sig enhetlig eller konsekvent.
Hur skiljer sig akustiskt palatala vokaler från velara?
Skillnaden ligger i F2.
- Palatala: Hög F2
- Velara: Låg F2
För en lyckad talproduktion krävs det exakt samordning av tre fysiologiska mekanismer. Vilka?
Respiration, fonation, artikulation
Vilken akustisk effekt har tillkoppling av näskaviteten på stämläppsklangen?
Dämpning.
Förklara kortfattat hur den aerodynamisk-myoelastiska och muco-undulatoriska teorin fungerar.
Glottis stängs genom att stämläpparna sugs ihop delvis pga Bernoullieffekten (det uppstår en kraft vinkelrätt mot en ström, vilket gör att stämläpparna sugs ihop och det bildas en tillslutning) och delvis genom stämläpparnas naturliga elasticitet. Då det subglottala trycket är högre än det supraglottala trycket, sprängs tillslutningen och glottis öppnas. Dess öppnings- och slutningsrörelser (svängningar) upprepas gång på gång.
Den muco-undulatoriska teorin kompletterar den aerodynamisk-myoelastiska teorin och beskriver hur vågrörelsen i det ytligaste lagret av slemhinnan, som täcker stämläppskroppen, påverkar fonationen.
Varför är det så svårt att studera röstproduktion. Fyra skäl.
Svåråtkomligt läge, små strukturer, svag vibrationshastighet, vag känsel
Rita ett schematiskt flödesglottogram och ange de olika faserna. Vad är det kurvan visar?
Flödesglottogrammet visar variationerna i luftflödets volymhastighet genom glottis vid fonation.
Hur fungerar observationsmetoden fiberoptik vid studiet av stämläpparna. Vilka problem finns?
Man betraktar stämläpparna uppifrån med en fiberoptisk kabel med en ljudkälla i som förs in genom näsan och därmed inte stör artikulationen avsevärt. Med denna metod kan stämläpparnas utseende och inställning observeras. Däremot krävs extra anordningar (t ex stroboskopi) för att se stämläpparnas mycket snabba svängningar.
Beskriv ett fotoglottogram.
Genom att mäta variationer i ett ljusflöde som passerar genom glottis vid fonation. Ljuskällan är placerad under glottis, riktad mot halsväggen. Ljuset som når svalget fångas upp med fiberoptik och omvandlas via en fotocell till elektrisk ström. Strömmen förs till en anordning som ritar en kurva, ett fotoglottogram.
Beskriv ett elektroglottogram.
Ett elektroglottogram visar variationen i det elektriska motståndet horisontellt över larynx under fonationen. Två elektrodplattor placeras på vardera sida om sköldbrosket. Mellan elektroderna leds ström med hög frekvens men svag styrka. Vid adduktion är motståndet lågt och vice versa. Motståndets storlek styr strömstyrkan som sedan styr en skrivare som ritar kurvan.
Förklara företeelsen tryckfall över glottis.
Det subglottala trycket måste överstiga det supraglottala trycket. Om det supraglottal trycket byggs upp, och tryckfallet därmed inte är stort nog, blir krafterna inte tillräckligt stora för att sätta igång och upprätthålla fonation.
Det händer ofta i svenskan och andra språk att stämläpparna slutar vibrera mot slutet av en tonande ocklusion. Vad är orsaken till detta?
Det supraglottala trycket ökar tills det är lika med det subglottala, varpå fonationen upphör.
Vilka fysikaliska faktorer ingår i begreppet intensitet?
Amplitud och tid
Varför brukar kvinnor ha högre formantfrekvenser än män?
Kvinnor har kortare talrör än män. Talrörets längd samt relationen mellan munhåla och svalg påverkar formantfrekvensens värde.
Varför brukar kvinnors röster vara svagare än männens under samma villkor?
Kvinnor tenderar ha visst läckage under fonationen, vilket leder till mindre effektiv ljudbildning med svagare övertoner, och därmed mindre total intensitet.
Varför är de faryngala vokalerna de intensivaste?
Resonanssamverkan. F1 och F2 ligger i faryngala vokaler nära varandra. Amplituderna adderas och formanterna blir starkare.
Vilken akustisk effekt har läpprundningen?
Sänkning av formanterna framför allt F2
Varför brukar underkäken sänkas för produktion av faryngala vokaler?
Det beror på formantfrekvensens samband med ansatsrörets form. F1 påverkas av variationer i käkvinkeln. Faryngaler har låg F1 och F1 sjunker med sänkning av underkäken.
På ett bredbandsspektrogram brukar man se tydliga formanter hos en mansröst. Hos en kvinnoröst däremot mest deltonerna. Varför?
För kvinnor ligger F0 högre än för män vilket f leder till större frekvensavstånd mellan deltonerna. Därmed blir de lättare att urskilja. Vidare innebär detta att för män ligger deltonerna tätare och framstår på spektrogrammet som svarta band.
Talperception – II
Jämför fonationstyperna falsett och knarr på den akustiska och auditiva nivån.
Vad menas med kategorisk perception? 2 exempel.
Förmågan att bara kunna diskriminera sådant som vi kan identifiera. Våra kognitiva mekanismer sorterar upp stimuli i distinkta fack som inte har någon fysisk motsvarighet. Då inga tydliga gränser mellan stimuli finns, lägger hjärnan till gränser. T ex jämnas olikheterna mellan två stimuli ut och två objekt kan då klassas som mer lika än vad de egentligen är i den fysiska verkligheten. ba da ga – ra la
Vilka två typer av teorier för talperception finns? Beskriv de viktigaste skillnaderna.
- Motorteorier
- Auditiva teorier
På vilka sätt skiljer sig transitionerna hos tonande klusiler och approximanter?
Transitionerna hos tonande klusiler är snabbare och kortare hos de tonande klusilerna.
På vilka grunder kan man påstå att talperception är en specialisering av en allmänmänsklig förmåga?
Människan söker och organiserar mönster. I talperception söker och organiserar vi akustiska mönster.
Vilka experimentella metoder används för att bestämma observerade akustiska egenskapers betydelse för perceptionen och därmed för lyssnaren?
Varför kan steady states inte vara de enda ledtrådarna för vokalperception. 4 orsaker.
- Talrörets storlek och utseende varierar – samma vokals formantfrekvenser varierar mellan kvinnor, män och barn, samtinom grupperna.
- Formantfrekvenserna påverkas av kontext och artikulationshastighet.
- Det är svårt att återfinna steady-state formanter i tal artikulerat i vanlig konversationshastighet.
- Lyssnare använder mönster snarare än exakta värden för formantfrekvenserna för att identifiera vokalerna.
Vilka två akustiska drag signalerar klusilernas artikulationsställe.
F2-transitioner och brusfrekvenser (explosionsbrus)
Inom vilka auditiva drag manifesteras svenskans prosodiska egenskaper?
Tonhöjd och upplevd längd
Vad är skillnaden mellan auditiv diskriminering och identifikation. 2 exempel.
Nämn fyra frågor som en bra teori för talperception måste kunna besvara.
- Hur börjar lyssnaren att ta ut den information som behövs för att kunna tolka och förstå yttrandet?
- Hur identifierar lyssnaren de olika språkljuden i talsignalen?
- Hur klarar lyssnaren av all variationen i talsignalen?
- Bearbetas signalen rent auditivt eller är produktionen också involverad?
Vilka icke lingvistiska funktioner har rösten.
Ljudskillnader används för att signalera andra saker än språkliga betydelser, t ex känslor, attityder, kön ålder och dialektal eller social tillhörighet.
Vilka lingvistiska funktioner har knarr?
Används fonologiskt i flera språk t ex i danskans stöd.
Vilket akustiskt drag signalerar den/de huvudsakliga skillnaden/erna mellan glädje resp. sorg?
Variationen i F0. Sorg – lite frekvensomfång, flackt intonationsmönster. Glädje – stort frekvensomfång; branta och omfattande förändringar i intonationsmönstret.
Argumentera mot uppfattningen att människan skulle ha akustiska feature detectors.
Vilken fonationstyp används som referens vid beskrivning av fonationstyperna. 3 skäl.
Modalregister. Stämläpparnas vibrationer är periodiska, effektiva och utan hörbart brus.
Vilka är de tre parametrarna i larynxstyrningen för produktion av fonationstyperna?
Adduktiv spänning, medial kompression och longitudinell spänning.
Karakterisera glottisinställningen för (1) viskning, (2) läckande röst (breathy voice).
- Inverterat y. Triangulär öppning av broskdelen på glottis. Låg adduktiv spänning, moderat/hög medial kompression, hög longitudinell spänning (aktiv VOC)
- Något öppen (aldrig sluten). Minimal adduktiv spänning, svag medial kompression, låg longitudinell spänning.
Karakterisera glottisinställningen för (1) knarr, (2) falsett.
- Liten del av ligamenten aktiva. hög adduktiv spänning, hög medial kompression, låg longitudinell spänning
- Något isärdragen. Hög adduktiv spänning, stor medial kompression, hög longitudinell passiv (CT) spänning.
Nämn 5 företeelser/egenskaper (lingvistiska och/eller paralingvistiska) som kan realiseras i F0-kurvan.
Lingvistiska:
Ordaccent, fokusaccent
Paralingvistiska:
Glädje, sorg, turtagning
Vilka anatomiska faktorer bestämmer i grunden en talares tonhöjd?
Stämbandens längd och varierande massa.
Vilka paralingvistiska funktioner har (1) viskning, (2) öppen nasalering?
- Hemlighetsfullhet, förtrolighet, turtagning (i vissa språk)
- Dialektal tillhörighet, trötthet
Vilka paralingvistiska funktioner har (1) pressad röst, (2) skrovlig röst?
- Signalerar att talaren är spänd på ett icke-konventionellt sätt.
- Signalerar ilska på ett icke-konventionellt sätt.
Varför har man inte lyckats med att entydigt kunna identifiera en person på rösten?
Rösten hos en person kan förändras t ex vid förkylning eller skador. Man kan också förställa rösten, ex vid imitation. Personer kan dessutom ha lika röster.
Vilka är de akustiska korrelaten till känslorna (a) sorg, (b) fruktan?
Vilka är de akustisk korrelaten till känslorna (a) överraskning, (b) vänlighet?
Ett steg talperceptionsprocessen är normalisering. Vad händer och varför?
Lyssnaren kompenserar för variationer i talsignalen som betingas av talars olika storlek och form på talapparaten. Detta reducerar den akustiska mångfalden och underlättar identifikation och kategorisering av ljuden i talsignalen.
Vilket är grundproblemet vid talperception?
Förklara företeelsen formantböjning (transition). Vad är det för något? På vilken fonetisk nivå förekommer den? Vad avspeglar den?
- Förändring i formantfrekvenser.
- Akustisk nivå
- Den avspeglar artikulatorernas rörelser och därmed förändringar i resonans.
Gör en systematisk jämförelse mellan uppgifterna om de olika rösstyperna hos Lindblad och Laver. Skiljer sig beskrivningarna åt?
Rita schematiskt in FO-förloppet till följande yttrande (standardsvenska):
Lèna köpte ràndiga ‘tòppar.
Vilka approximanter förekommer i svenskan?
/, j, /


