蔡清教授團隊在實驗與認知心理(lǐ)學國際知名期刊Behavior Research Methods發表科研成果

時(shí)間:2023-03-20浏覽:120設置

多(duō)模态漢語兒(ér)童語言環境語料與數據庫

語言能力是兒(ér)童早期發展的(de)最基礎能力,而環境則是影(yǐng)響兒(ér)童語言發展的(de)最關鍵因素之一。在發展和(hé)語言心理(lǐ)學領域,大(dà)量研究結果表明(míng),嬰幼兒(ér)所處環境中的(de)語言輸入量、詞彙多(duō)樣性、互動性程度等特征,不僅能顯著預測兒(ér)童的(de)語言能力與發展水(shuǐ)平,也(yě)與他(tā)們的(de)多(duō)項認知功能緊密相關。

以往研究嬰幼兒(ér)的(de)語言環境,通(tōng)常以家庭成員(yuán)的(de)父母語(又稱兒(ér)向語)語料爲研究對(duì)象。但當兒(ér)童長(cháng)到2-3歲,進入詞彙爆發和(hé)複雜(zá)語言結構高(gāo)速發展時(shí)期,他(tā)們也(yě)開始接觸更加多(duō)樣化(huà)、跨模态的(de)語言環境,如讀繪本、看電視、使用(yòng)pad等電子設備。因此,爲了(le)更全面了(le)解這(zhè)一階段兒(ér)童的(de)語言環境特征及其影(yǐng)響,需要将研究對(duì)象從父母語擴展到囊括多(duō)類模态的(de)語料。然而,此類語料匮乏,導緻我們對(duì)這(zhè)一時(shí)期兒(ér)童語言環境的(de)理(lǐ)解一直比較有限。

爲了(le)解決這(zhè)一問題,華東師範大(dà)學心理(lǐ)與認知科學學院蔡清教授團隊搭建了(le)首個(gè)基于動畫(huà)語料的(de)漢語兒(ér)童視聽(tīng)語料庫和(hé)語言數據庫,并在實驗與認知心理(lǐ)學國際知名期刊Behavior Research Methods發表了(le)題爲CCLOOW: Chinese children’s lexicon of oral words的(de)論文,介紹該項數據庫工作。該庫是國際上首個(gè)基于動畫(huà)視聽(tīng)語料的(de)兒(ér)童語言數據庫,統計了(le)頻(pín)率、語境多(duō)樣性、詞性等多(duō)項字詞水(shuǐ)平的(de)特征指标,涵蓋近200部熱(rè)門動畫(huà)片和(hé)動畫(huà)電影(yǐng)、共270萬字、180萬詞語料。這(zhè)一數據庫不僅對(duì)團隊前期發布的(de)CCLOWW漢語兒(ér)童書(shū)面字詞數據庫Li et al., 2022進行了(le)補充,也(yě)提供了(le)研究漢語兒(ér)童多(duō)模态語言環境的(de)重要基礎資源。

基于這(zhè)兩個(gè)跨模态語料庫的(de)字詞統計指标,團隊進一步開展了(le)一系列兒(ér)童字詞認讀實驗,以考察兒(ér)童的(de)詞彙知識如何受到跨模态語言環境的(de)影(yǐng)響。結果發現,在預測二年級兒(ér)童的(de)詞彙認讀表現時(shí),視聽(tīng)語言環境中的(de)詞彙層面指标比書(shū)面環境中詞彙指标的(de)解釋力更強,但書(shū)面環境中漢字層面的(de)解釋力更強。這(zhè)說明(míng),7-8歲兒(ér)童雖然已經開始識字且擁有一定閱讀經驗,但他(tā)們的(de)書(shū)面詞彙知識仍然極大(dà)地受到視聽(tīng)語言環境的(de)影(yǐng)響。由于當前一年級語文教育以識字爲主,因而書(shū)面環境中的(de)漢字經驗也(yě)影(yǐng)響著(zhe)他(tā)們的(de)詞彙知識。此外,在另一項成人(rén)詞彙認讀實驗中,團隊還(hái)發現,CCLOOW兒(ér)童視聽(tīng)詞頻(pín)也(yě)能顯著預測成人(rén)的(de)詞彙加工效率,并且,在成人(rén)詞頻(pín) (來(lái)自SUBTLEX-CH數據庫,Cai & Brysbaert, 2010的(de)影(yǐng)響之外,CCLOOW兒(ér)童視聽(tīng)詞頻(pín)信息對(duì)預測成人(rén)的(de)詞彙加工效率也(yě)有顯著的(de)額外貢獻,這(zhè)表明(míng)早期語言教育對(duì)語言能力發展的(de)長(cháng)足影(yǐng)響。



CCLOOW數據庫已在線公開發布https:// www.learn2read.cn/ccloow,免費供研究者、家長(cháng)和(hé)教育工作者使用(yòng)。用(yòng)戶亦可(kě)通(tōng)過Learn2Read首頁“兒(ér)童數據庫”選擇“口語數據庫”訪問。該在線數據庫提供了(le)基于動畫(huà)語料統計的(de)漢字、詞層面的(de)數據搜索和(hé)下(xià)載功能,用(yòng)戶可(kě)通(tōng)過 “使用(yòng)說明(míng)”查看對(duì)各項指标的(de)解釋和(hé)計算(suàn)方法。


蔡清教授團隊


截止目前,蔡清教授研究團隊已開展一系列漢語語言數據庫工作,包括CCLOOW兒(ér)童視聽(tīng)語言數據庫、CCLOWW兒(ér)童書(shū)面語言數據庫、SUBTLEX-CH電影(yǐng)字幕數據庫。這(zhè)些工作爲心理(lǐ)學、語言學和(hé)教育學領域研究研究漢語加工、習(xí)得(de)與發展提供了(le)寶貴的(de)基礎工具。基于這(zhè)些語料和(hé)數據庫的(de)後續研究正在進行中。此外,團隊也(yě)通(tōng)過結合行爲學、影(yǐng)像學和(hé)基因等多(duō)種方法,廣泛探索語言及其發展的(de)認知神經機制問題。

華東師範大(dà)學心理(lǐ)與認知科學學院蔡清教授、明(míng)園晨晖學者王婧爲本數據庫相關論文的(de)通(tōng)訊作者,博士後李鸾爲第一作者,本科生趙文濤、博士生宋明(míng)爲本研究做(zuò)出了(le)重要貢獻。研究得(de)到了(le)國家自然基金(3197098732100857、上海市科學技術委員(yuán)會(19JC1410100)、上海市腦(nǎo)功能基因組學重點實驗室開放課題和(hé)華東師範大(dà)學青年預研究項目(2022ECNU-YYJ021)的(de)資助。

蔡清教授團隊現正招聘博士後,歡迎對(duì)語言和(hé)兒(ér)童發展研究感興趣的(de)海内外優秀博士人(rén)才加入。有意者請聯系:qcai@psy.ecnu.edu.cn


論文信息:

  1. Li, L., Zhao, W. T., Song, M., Wang, J., Cai, Q. (2023) CCLOOW: Chinese children’s lexicon of oral words. Behavior Research Methods. https://doi.org/10.3758/s13428-023-02077-6.

  2. Li, L., Yang, Y., Song, M., Fang, S.-Y., Zhang, M.-Y., Chen, Q.-R., Cai, Q. (2022). CCLOWW: A grade-level Chinese children’s lexicon of written words. Behavior Research Methods. https://doi.org/10.3758/s13428-022-01890-9.

  3. Cai, Q., & Brysbaert, M. (2010). SUBTLEX-CH: Chinese word and character frequencies based on film subtitles. PloS one5(6), e10729.



返回原圖
/