美國著名語言測試專家L. Bachman(1990:279)指出:“測試的開發(fā)和使用不是在毫無實用價值的心理測量的試管中進行試驗;測試必定是為滿足某些需求而開發(fā)的,這些需求可能是教育體系內部的,也可能是整個社會的需求!币陨姓Z言測試專家B. Spolsky(1995:358)在討論測試目的的重要性時,十分贊同Bachman的觀點。他說:“正如Bachman所強調的,語言測試同所有的測試一樣,首要任務就是明確考試的目的!
語言測試的開發(fā)和實施是為了適應社會對人才培養(yǎng)的要求,社會對所需人才的要求決定了我們的教學要求,而教學要求決定了語言測試的內容和形式。因此,語言測試改革的原動力是社會發(fā)展對人才培養(yǎng)提出了新的要求。
但是,教學與測試之間不是簡單的“教學決定測試”(dog-wagging-tail)或“測試指揮教學”(tail-wagging-dog)的關系(Li X.J. and Y.Q. Zeng 2002)。早在80年代末,英國測試專家A. Hughes(1989:47)就明確提出考試對教學正確導向作用的重要性。他指出:“如果考試設計者認識到由于考試對教學的不正確的導向作用,使學生和教師把寶貴的時間和精力浪費在無助于他們達到學習目的的教學活動中,那么,他們將會不惜一切代價使所設計的考試對教學產生正面反撥作用! 90年代起英國測試專家D. Wall和J. C. Alderson對考試后效開始進行仔細的、系統(tǒng)的研究(Wall and Alderson 1993),提出了許多富有創(chuàng)見性的假設并進行了論證。Wall(2000:507)指出:“對考試的評價不應簡單地以其‘技術效率’(technical efficiency)為標準,而應該考慮其是否具有‘教學效益’(educationally profitable)。只有當考試對課堂教學的影響是‘利大于弊’時,才能認為該考試是‘有利可圖’的!
由于大學英語四、六級考試是大學英語教學的一種檢測手段,同時也是大學英語教學的一個環(huán)節(jié),因此改進其對教學的后效,即考試的反撥作用,是本次考試改革的重點。也就是說,四、六級考試改革的方向是在保持考試的科學性、客觀性和公正性的同時,使考試最大限度地對大學英語教學產生正面的導向作用,即通過改革,進一步引導師生正確處理教學與考試的關系,更合理地使用四、六級考試,使考試更好地為教學服務。
在我國改革開放日益深化的新世紀之初,大學生用英語通過“聽”來獲取信息并通過‘說’來表達思想以參與國際交流的機會越來越多。也就是說,新的社會需求對大學生的英語能力提出了更高的要求,即不僅能通過閱讀來獲取信息,還能以英語為工具,參與學術交流活動,如聽學術報告、參加學術討論等。為此,教育部于2003年初成立了大學英語教學改革項目組,制定了新的《教學要求》,提出了新的大學英語課程教學目標,即培養(yǎng)學生英語綜合應用能力,特別是聽說能力,使他們在今后工作和社會交往中能用英語有效地進行口頭和書面的信息交流。
因此,大學英語四、六級考試改革將對考試內容和考試形式進行改革,目標是更準確地測量我國在校大學生的英語綜合應用能力,尤其是英語聽說能力,以體現社會改革開放對我國大學生英語能力的要求。
二、大學英語四、六級考試近期改革
大學英語四、六級考試近期改革的首要任務是通過計分體制和成績報導方式的改革,引導廣大師生和學校行政部門合理使用四、六級考試;其次,通過所測能力結構和題型的調整,進一步推動各校朝《教學要求》所規(guī)定的教學目標努力,使教師和學生更加重視英語綜合應用能力的培養(yǎng)。
1.改革計分體制和成績報導方式
考試從某種意義上說是一把雙刃劍,既能為教學提供評估,但若使用不合理,也可能會產生一定的負面作用。近年來,隨著社會對所需人才的英語能力的要求不斷提高,也隨著四、六級考試逐步被社會認可,四、六級考試的使用漸漸超出了最初設計者所預期的教學考試范圍,社會權重不斷增加,考試規(guī)模不斷擴大,隨之產生了一些問題,如四、六級考試證書與學生畢業(yè)或學位不合理地掛鉤、應試教育、作弊違紀等。因此,考試的改革首先必須考慮如何使考試結果的使用更加合理。為此,近期將采取的重要舉措之一是改革四、六級考試計分體制和成績報導方式。
目前每次四、六級考試的分數經過數據處理后,報導均值為72,標準差為12、總分為100的正態(tài)分,并發(fā)合格(定為60分)和優(yōu)秀(定為85分)證書。自2005年6月考試起,四、六級考試的分數在經過加權、等值、正態(tài)化數據處理后,將報導均值為500、標準差為70、成績全距在290分至710分之間的正態(tài)分。
為改變以簡單的考試通過率來評價教學或學生能力的現狀,四、六級考試將不設及格線,考試合格證書將改為成績報告單,即考后向每位考生發(fā)成績報告單,報導其總分和各部分的單項分。這樣,教師可以更充分地了解教學的長處和短處,學生也可了解自己語言能力上的強項和弱項。為使學校理解考試分數的含義,四、六級考試委員會將向學校提供四、六級考試分數的解釋。
四、六級考試歷年來的數據表明,全國大學生英語能力的發(fā)展是不平衡的。由于學校的辦學條件不同,生源條件不同,教學目標不同,地區(qū)之間、學校之間的差異很大,因此,我們期望四、六級考試的計分體制和成績報導方式改革后,學校對學生的英語能力要求不再是一刀切,而是根據各校的實際情況,提出切實的教學要求,甚至可以對不同專業(yè)的學生的聽、說、讀、寫能力提出不同的要求,以利于教學行政部門作出合理的教學安排。
2.調整所測試的語言能力結構
在考試內容方面,近期改革的重點是聽力理解部分。根據80年代制定的教學大綱,大學英語教學的重點是培養(yǎng)學生較強的閱讀能力。經過近20年的努力,我國大學生的英語閱讀能力有了顯著的提高(楊惠中2004)。四、六級考試成績表明,閱讀部分的平均分逐年穩(wěn)步提高。四級考試第一個五年(1987—1991)平均分是25分(總分40分),第二個五年(1992—1996)是26分,第三個五年(1997—2001)達到了27.5分。
在新時期,改革開放對大學生的英語能力提出了新要求,《教學要求》明確提出要加強聽說能力的培養(yǎng)。具體體現在四、六級考試改革方案中就是加大聽力理解部分的題量和比例。聽力理解部分題量從20題增加到35題,比例從20%提高到35%。當然這并不意味著閱讀能力不重要了,而是我們對聽力理解能力提出了更高的要求。
除聽力理解部分的改革外,閱讀理解部分和詞匯部分也作了相應的調整。閱讀部分比例調整為35%,除原有的仔細閱讀外,新增了對快速閱讀技能的測試;原四、六級考試中的單句詞匯理解和語法結構題改為篇章語境中的詞匯理解測試,作為仔細閱讀的一部分。
試點的四、六級考試由四部分構成:聽力理解、閱讀理解、綜合測試和寫作測試。聽力理解的35%中,聽力對話占15%,聽力短文占20%。聽力對話采用選擇題,包括短對話和長對話的聽力理解,其中長對話是新增加的測試內容;聽力短文采用兩種題型:短文聽寫(復合式聽寫)和選擇題;聽力題材選用對話、講座、廣播電視節(jié)目等更具真實性的材料。閱讀理解的35%中,仔細閱讀(careful reading)占25%,題型采用選擇題;快速閱讀部分(fast reading)占10%,采用是非判斷題、句子填空或其他題型。綜合測試比例為15%,由兩部分構成。第一部分為完型填空或改錯(錯誤辨認并改正),即每次考試兩者選一,占10%;第二部分為篇章簡短問答或句子翻譯(中譯英),也是每次考試兩者選一,占5%。寫作能力測試部分比例不變,仍為15%,體裁包括議論文、說明文、應用文等。表1和表2分別是現行的和將試點的四、六級考試各部分測試內容、題型和所占整卷的比例。
表1 現行的四、六級考試各部分測試內容、題型和所占比例
試卷構成 |
測試內容 |
測試題型 |
比例 | |
第一部分:聽力理解 |
聽力對話 |
短對話 |
多項選擇 |
20% |
聽力短文 (兩者選一) |
短文理解 或 |
多項選擇 | ||
短文聽寫 |
復合式聽寫 | |||
第二部分:閱讀理解 |
篇章閱讀理解 |
多項選擇 |
40% | |
第三部分:詞匯與結構 |
單句詞匯理解和語法結構 |
多項選擇 |
15% | |
第四部分:綜合測試 |
四者選一:完型填空 或 |
多項選擇 |
10% | |
改錯 或 |
錯誤辨認并改正 | |||
篇章問答 或 |
簡短回答 | |||
翻譯 |
英譯中 | |||
第五部分:寫作 |
寫作 |
短文寫作 |
15% |
2 試點的四、六級考試各部分測試內容、題型和所占比例
試卷構成 |
測試內容 |
測試題型 |
比例 | |
第一部分:聽力理解 |
聽力對話 |
短對話 |
多項選擇 |
35% |
長對話 |
多項選擇 | |||
聽力短文 |
短文理解 |
多項選擇 | ||
短文聽寫 |
復合式聽寫 | |||
第二部分:閱讀理解 |
仔細閱讀理解 |
篇章閱讀理解 |
多項選擇 |
35% |
篇章詞匯理解 |
選詞填空 | |||
快速閱讀理解 |
是非判斷+句子填空或其他 | |||
第三部分:綜合測試 |
兩者選一:完型填空 或 |
多項選擇 |
15% | |
改錯 |
錯誤辨認并改正 | |||
兩者選一:篇章問答 或 |
簡短回答 | |||
句子翻譯 |
中譯英 | |||
第四部分:寫作 |
寫作 |
短文寫作 |
15% |
3.測試題型上的改革
根據以上試卷設計(表2)可以看出,四、六級考試的題型也有所改革。非選擇性試題的比例將增加到35%至45%。非選擇性試題指的是聽力部分的復合式聽寫、快速閱讀部分的句子填空、綜合測試部分的改錯、簡短問答或句子翻譯以及寫作。
多項選擇題在大規(guī)模標準化考試中的使用仍是目前語言測試界爭論的焦點之一。而就目前語言測試這門學科的發(fā)展水平來看,大規(guī)模標準化考試的信度(即測量的準確、可靠、公正性)和效度(即測試是否考了應該考核的能力)仍然是一對難以兩全的矛盾,是語言測試面臨的兩難命題?茖W的多項選擇題可以保證測試采樣面的寬度,而且信度很高。但多項選擇題的效度很難達到十分理想的狀態(tài),對教學的后效也因此而受到影響。而作文、口試、回答問題、翻譯等主觀題效度很高,教學后效特別好,但需要付出很大代價才能取得基本滿意的評分客觀一致性。目前四、六級筆試采用了考前閱卷員培訓、評分過程中的抽查、評分后的復查等方式,口試則采用了考前主考的培訓、口試中兩位主考同時評分、考后抽查復審等方式,力求取得主觀試題滿意的信度。但是,信度和效度之間平衡問題的根本解決受到大規(guī)模標準化考試可操作性的制約:對于象英語四、六級這種每年上千萬人的超大規(guī)模標準化考試,適合機器閱卷的選擇性試題仍然是主要的題型,四、六級考試的改革目前只能在信度和效度之間找到一個平衡點,兼顧兩者。
以上是四、六級考試筆試部分的近期改革方案。近期內大學英語四、六級考試口語考試仍將與筆試分開進行,繼續(xù)實施面試型四、六級口語考試(CET-SET)。四、六級口語考試的研究開始于90年代中期,經過長達四年的理論研究和試點,考委會于1999年開始在全國范圍內實施口語考試。五年來,四、六級口語考試的規(guī)模不斷擴大,目前在全國36個省會城市共設立了51個口語考點,每年參加考試的人數已近十萬。
面試型口語考試的最大優(yōu)點是能夠讓考生之間、考生與考官之間開展互動的交流,因而是最具真實性的口語考試方式,其理想的測試效度和對教學的后效使其他任何形式的口語考試相形見絀。但是十萬考生僅僅是全體四、六級考生中極小的一部分,也是已設考點的城市中有資格參加四、六級口語考試(即四級在80分及以上,或六級在75分及以上)的考生總數中的小部分。如果參加四、六級口語考試的考生人數大幅度增加,那么從實施上來說困難不小,如缺乏數量足夠的合格考官、合適的考場以及有關考試設備。另外,在考生人數少的情況下過高的考試成本也會給考試的實施帶來困難。因此,研究開發(fā)一個更具有可操作性、能適應不斷擴大的考生規(guī)模且能降低考試所需的人力和物力的口語考試已勢在必行。目前,非面試型口語考試(如錄音、電話、計算機化等)在大規(guī)模標準化考試中已有不少成功的范例,但一般形式的非面試型口語考試并不一定適用于四、六級考試。因此,考委會正在積極研究開發(fā)計算機化的四、六級口語考試,以進一步擴大口語考試規(guī)模,推動大學英語口語教學。
4.近期改革工作進程
由于四、六級考試是一個每年涉及上千萬考生的超大規(guī)模標準化考試,因此考試內容和形式的改革須經過一定規(guī)模的試點,以便對新試卷的有效性和可行性作出科學的論證,同時了解師生的反饋。為此,四級考試從2006年1月開始試點,六級考試試點從2006年6月開始。參加試點考試的對象是180所大學英語教學改革試點院校的部分學生。在試點過程中,考委會將根據《教學要求》建立四、六級考試新常模、制訂新的四、六級考試大綱、完成新的考試樣題,并將及時向教師和學生公布。全面實施改革后的大學英語四級考試的時間暫定為2007年1月,六級考試為2007年6月。
三、大學英語四、六級考試未來展望
任何一項大規(guī)模標準化考試的發(fā)展都是一個不斷改進和完善的過程。四、六級考試17年的發(fā)展歷程也證明了這一點(金艷2004)。國家改革開放對我國大學生的英語交際能力不斷提出更高的要求,因此,考試的中長期改革任務仍十分艱巨。國內外考試理論和實踐的發(fā)展證明,一個大規(guī)模標準化考試機構必須依靠強大的科研隊伍的支撐。因此,四、六級考試委員會將長期地開展考試的基礎理論研究和應用研究。改革方案的最后部分是四、六級考試中長期的改革規(guī)劃。概括來說,四、六級考試中長期改革的重點是加強標準化考試的理論和實踐的研究,完善四、六級考試系列;跟蹤考試改革進程,研究四、六級考試對大學英語教學的后效;開發(fā)利用高科技,實現考試實施和考務管理的現代化。
1.加強標準化考試的理論和實踐的研究,完善四、六級考試系列
標準化考試以其測試過程、手段和評價標準的科學性、有效性和高效率而適用于各種大規(guī)模考試。但是,由于標準化考試較多地采用客觀題形式的考題,從而常常被簡單地等同于打勾劃圈的多項選擇題。在考試改革過程中,一方面,四、六級考試委員會將不斷研究開發(fā)適合四、六級考試的新題型;另一方面,將加強對標準化考試所采用的測量標準(measurement criteria)、測量手段(measurement instruments)以及測量過程(measurement procedures)的研究,使考試結果更準確、客觀、全面地反映學生英語綜合應用能力,并最大限度地對教學產生正面的導向作用。此外,考委會將根據對目前國內、國際語言測試理論和實踐的研究和分析,制訂以中國英語學習者為對象、能與國際接軌的英語語言能力等級量表,以更準確地描述我國大學生的英語能力。
大學英語四、六級考試還將進一步完善其考試系列,更好地適應不同層次學校的需要,更有利于分層管理、分類指導?嘉瘯䦟⒀芯块_發(fā)入學水平考試(CET-Placement Test),用于測量大學生入學時的英語水平,為學校制定切實可行的教學目標提供依據,并采用"平均級點分"等統(tǒng)計手段,更準確地反映教學的進步幅度,以調動廣大師生的教學積極性;研究開發(fā)高端考試(CET-Advanced Level),用于測試學生是否達到《教學要求》中"更高要求"所規(guī)定的英語綜合應用能力,即能以英語為工具,直接參與國際學術會議、國際學術交流等。
2.跟蹤改革進程,研究考試對教學的后效
四、六級考試委員會將關注改革措施的后效,跟蹤考試改革對教學所產生的影響。在對考試后效的研究中,Wall(2000: 507)明確提出:"對考試改革項目的評估必須從改革一開始就啟動,并定期地進行。評估不僅應涵蓋考試的設計和實施,還應包括了解教師和學生等對改革的認識和看法,以及考試改革對教學的影響。"在最近出版的《語言測試的反撥作用》一書(Cheng, Watanabe, and Curtis 2004)的序言中,J. C. Alderson指出,"考試的后效,無論是正面還是負面的,與其說是考試帶來的,不如說是通過教師的教學實現的。"
為此,考委會選擇了一批參加四、六級考試的院校作為聯(lián)絡點院校,這些院校有重點、非重點院校,類別包括理工、綜合、文科、師范、醫(yī)科、農學院等?嘉瘯奈瘑T將加強與這些院校的溝通,保持定期的聯(lián)系,及時將考試信息反饋給各院校,指導各校正確理解和使用考試結果,并組織這些院校參加四、六級考試的預測、對比考、常模建立等工作。我們相信,通過院校的參與,四、六級考試的改革思想將更好地得到理解和宣傳,這樣考試改革才能真正達到其根本目的,即進一步引導師生正確處理教學與考試的關系,更合理地使用四、六級考試。
此外,有必要指出,大學英語四、六級考試不能等同于大學英語教學評估。有教學就需要有評估,要評估就會有考試,但大學英語四、六級這樣的標準化考試僅是大學英語教學評估的一種方式。教學評估應該是全面的、多樣化的評估。四、六級考試是在完成了大學英語的教學任務后進行的終結性評估(summative test),能從一定程度上反映教學的結果,但不是對整個教學過程或教學全貌的評估。在語言教學過程中,應注重形成性測試(formative test),如學生的自我測試(self-assessment)、教師在各教學階段的診斷性測驗(diagnostic test)等,跟蹤和評估教學過程,以便及時調整教學計劃和教學方法。
3.開發(fā)利用高科技,實現考試手段和考務管理的現代化
在科學技術日益發(fā)達的今天,大規(guī)模標準化考試的實施和管理也應充分利用高科技手段。目前,四、六級考試已在20萬份試卷的規(guī)模上進行了兩次網上主觀題閱卷(CET-Online Marking)的試點,并將在進一步擴大試點的基礎上,全面推行四、六級網上閱卷系統(tǒng),為全面實施改革后的四、六級考試的閱卷工作做好技術上的準備。同時,在考務管理上,四、六級考試也將采用先進技術,加強對考場組織和考風考紀的管理,嚴防考試作弊違紀,杜絕考前泄密。
科技的發(fā)展還將給考試手段和實施方式的改進提供廣闊前景,許多紙筆考試無法采用的題型在計算機化考試中很容易實現,考試的報名、組織和實施可以分散在不同的時間、不同的地點進行。長遠來看,這也許是解決大規(guī)模標準化考試的效度、信度和可操作性之間平衡問題的最終出路。四、六級考委會在上世紀末已經開始了計算機化四、六級考試(CET-CBT)的研究,目前努力的方向是爭取盡早在一定考生范圍內或在某種能力測試中實現四、六級機考。
四、結束語
通過17年的努力,四、六級考試建立了一整套標準化考試的流程、體系和標準,基本滿足了大規(guī)模標準化考試的專業(yè)質量要求,如命題的專業(yè)化、測試和評分的客觀和一致、成績的可比性和分數的可解釋性、施考條件和過程的嚴密、公正和高效以及大規(guī)?荚囁蟮目刹僮餍缘。但是,我們必須清醒地認識到,四、六級考試改革勢在必行,而且這樣一個大規(guī)模標準化考試的改革是一項復雜的系統(tǒng)工程,任重而道遠。因此, 在改革過程中,我們將充分考慮大規(guī)模標準化考試的質量要求,努力做到前瞻性與可行性相結合,并對各種方案經過嚴格的科學論證,分步實施。全國大學英語四、六級考試委員會將在教育主管部門的領導下,在開展考試改革的同時,加強宣傳,使教師和學生真正了解改革的目的和舉措,并通過教師培訓等手段使改革思想融入教學,使四、六級考試更好地服務于我國大學英語教學。
參考文獻:
Bachman, L.F. (1990) Fundamental Considerations in Language Testing. Oxford University Press.
Cheng, L.Y., Y. Watanabe, and A. Curtis (Ed.) (2004) Washback in Language Testing: Research Contexts and Methods. Lawrence Erlbaum Associates, Inc.
Hughes, A. (1989) Testing for Language Teachers. Cambridge University Press.
Li, X.J. and Y.Q. Zeng (2002) Language testing and teaching: Is the tail wagging the dog? Paper presented at the International Conference on Language Testing and Language Teaching. Shanghai: Shanghai Jiao Tong University.
Spolsky, B. (1995) Measured Words. Oxford University Press.
Wall, D. (2000) The impact of high-stakes testing on teaching and learning: can this be predicted or controlled? System 28, 499-509.
Wall, D. and J.C. Alderson (1993) Examining washback: The Sri Lankan impact study. Language Testing 10, 41-69.
金艷. 改革中的大學英語四、六級考試[J]. 中國外語,2004(1).
楊惠中. 從四、六級考試看我國大學生當前的英語語言能力現狀[J]. 中國外語,2004(1).
大學英語教學大綱(高等學校理工科本科用)(1985). 上海:上海外語教育出版社.
大學英語教學大綱(高等學校文理科本科用)(1986). 上海:上海外語教育出版社.
大學英語教學大綱(修訂本)(1999). 上海:上海外語教育出版社;北京:高等教育出版社.
大學英語課程教學要求(試行)(2004). 上海:上海外語教育出版社.
(本文作者是全國大學英語四、六級考試委員會主任委員)
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內蒙古 |