Luận văn Tìm hiểu về các phương pháp tạo chỉ số thống kê và ứng dụng

pdf 62 trang Khánh Chi 25/04/2025 190
Bạn đang xem 30 trang mẫu của tài liệu "Luận văn Tìm hiểu về các phương pháp tạo chỉ số thống kê và ứng dụng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfluan_van_tim_hieu_ve_cac_phuong_phap_tao_chi_so_thong_ke_va.pdf

Nội dung tài liệu: Luận văn Tìm hiểu về các phương pháp tạo chỉ số thống kê và ứng dụng

  1. ĐẠI HÅC QUÈC GIA HÀ NËI ĐẠI HÅC KHOA HÅC TỰ NHIÊN —————————————– Nguy¹n Phương Ly TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SÈ THÈNG KÊ VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KHOA HÅC Hà Nëi - N«m 2019
  2. ĐẠI HÅC QUÈC GIA HÀ NËI ĐẠI HÅC KHOA HÅC TỰ NHIÊN —————————————– Nguy¹n Phương Ly TÌM HIỂU VỀ CÁC PHƯƠNG PHÁP TẠO CHỈ SÈ THÈNG KÊ VÀ ỨNG DỤNG Chuy¶n ngành: Lý thuy¸t x¡c su§t và thèng k¶ to¡n học M¢ sè: 8460112.02 LUẬN VĂN THẠC SĨ KHOA HÅC NGƯỜI HƯỚNG DẪN KHOA HÅC: TS. Trịnh Quèc Anh Hà Nëi - N«m 2019
  3. Lời nói đầu Trong bèi c£nh hëi nhªp quèc t¸ như hi»n nay, vi»c n¥ng cao n«ng lực cõa đội ngũ c¡n bë là mët trong nhúng y¸u tè quan trọng nh§t c¦n chú trọng; v¼ vªy, gi¡o dục và kiºm định đánh gi¡ gi¡o dục là mët ph¦n then chèt giúp Vi»t Nam ta hiºu và ph¥n t½ch được c¡c thông tin để đối chi¸u với mục ti¶u, ti¶u chu©n đề ra, nh¬m có nhúng quy¸t định th½ch hñp để điều ch¿nh, n¥ng cao ch§t lượng và hi»u qu£ gi¡o dục. Trong bài kiºm tra đánh gi¡ n«ng lực, c¡c ph£n hồi thô cõa học sinh có hai kh½a c¤nh quan trọng là độ ch½nh x¡c và thời gian ph£n hồi. Tø trước đến nay, ở c¡c bài kiºm tra đánh gi¡ người ta thường ch¿ quan t¥m đến độ ch½nh x¡c cõa c¥u tr£ lời và dựa vào sè c¥u đúng sai để đánh gi¡ n«ng lực cõa học sinh. Tuy nhi¶n g¦n đây, với sự ph¡t triºn cõa m¡y t½nh và công ngh» thông tin, ta đã có thº d¹ dàng ghi l¤i được thời gian ph£n hồi tøng c¥u hỏi cõa học sinh khi cho làm kiºm tra tr¶n m¡y t½nh để tø đó, đưa ra đưñc k¸t qu£ ch½nh x¡c hơn v· n«ng lực cõa học sinh đó. Luªn v«n này là bước ph¡t triºn ti¸p nèi sau khóa luªn cõa em, nghi¶n cùu th¶m v· y¸u tè thời gian ph£n hồi trong đánh gi¡ n«ng lực người học. Luªn v«n gồm ba chương. Chương 1: Ki¸n thùc chu©n bị. Chương này tr¼nh bày l¤i nhúng ki¸n thùc chu©n bị v· mô h¼nh ùng đáp c¥u hỏi, ph¥n phèi chu©n, ph¥n phèi lognormal để làm ti·n đề nghi¶n cùu mô h¼nh ph£n hồi thời gian lognormal ở chương hai. C¡c ki¸n thùc v· suy luªn Bayes, phương ph¡p x½ch Markov và đặc bi»t là gi£i thuªt Gibbs cũng được nh­c l¤i để giúp cho ph¦n ước lượng tham sè ở chương hai và chương ba được rã ràng hơn. Chương 2: Mô h¼nh thời gian ph£n hồi ùng đáp c¥u hỏi lô-ga-rit chu©n (Lognormal Item Response Theory). Chúng tôi giới thi»u l¤i v· lịch sû ph¡t triºn cõa mô h¼nh ph£n hồi thời gian, nói v· động lực để ¡p dụng mô h¼nh lô-ga-rít chu©n cho thời gian ph£n hồi cõa th½ sinh và so s¡nh nó với mô h¼nh chu©n cho thời gian ph£n hồi. Phương 1
  4. Lời nói đ¦u ph¡p ước lượng tham sè b¬ng gi£i thuªt Gibbs cũng được đưa ra ở ph¦n này. Chương 3: Nghi¶n cùu thực nghi»m. Ph¦n này tr¼nh bày l¤i rã ràng hơn v· nghi¶n cùu thực nghi¶m đ¢ ¡p dụng mô h¼nh ph£n hồi thời gian lognormal cho ph¥n t½ch dú li»u trong bài thi th½ch ùng ở Mỹ cũng như s­p x¸p m¨u, ước lượng tham sè và xem x²t độ phù hñp cõa mô h¼nh. Luªn v«n được hoàn thành t¤i trường Đại học Khoa học tự nhi¶n - Đại học quèc gia Hà Nëi, dưới sự hướng d¨n cõa TS. Trịnh Quèc Anh. Em ch¥n thành c£m ơn th¦y Trịnh Quèc Anh, c¡c nghi¶n cùu sinh và học trá cõa th¦y. Trong qu¡ tr¼nh nghi¶n cùu, mặc dù cán nhi·u sơ su§t nhưng em đã được th¦y tªn t¼nh d¤y dé, hướng d¨n, cũng như động vi¶n em trong suèt thời gian làm vi¶c. Ngoài ra em muèn gûi lời c¡m ơn s¥u s­c đến c¡c thành vi¶n cõa nhóm seminar X¡c su§t thèng k¶, Đại học Khoa học tự nhi¶n đã góp ý r§t nhi·u trong qu¡ tr¼nh em hoàn thành luªn v«n. Em cũng xin bày tỏ láng bi¸t ơn c¡c th¦y cô và c¡n bë cõa trường Đại học khoa học tự nhi¶n đã quan t¥m giúp đỡ trong qu¡ tr¼nh học tªp và nghi¶n cùu t¤i trường. Em cũng xin tỏ láng bi¸t ơn s¥u s­c đến gia đình, bè mẹ, anh chị em và anh Ph¤m Hồng Vi»t đã b¶n c¤nh đồng hành, giúp đỡ, t¤o đi·u ki»n trong suèt qu¡ tr¼nh em học tªp và làm luªn v«n th¤c sĩ. C£m ơn hai thi¶n th¦n b² nhỏ Hồng Qu¥n, Hồng Ngọc đã là động lực to lớn giúp em cè g­ng vượt qua nhúng khó kh«n trong qu¡ tr¼nh nghi¶n cùu để hoàn thành đưñc luªn v«n. Hà Nëi, ngày 10 th¡ng 12 n«m 2019 Nguy¹n Phương Ly 2
  5. Mục lục Lời nói đầu 1 Danh mục ký hi»u và chú vi¸t t­t 8 1 Ki¸n thùc chu©n bị 10 1.1 Mô h¼nh IRT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.2 Ph¥n phèi chu©n . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.3 Ph¥n phèi lognormal . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.4 Suy luªn Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.1 Suy luªn Bayes cho bi¸n ng¨u nhi¶n rời r¤c . . . . . . . . . . . . 22 1.4.2 Suy luªn cõa Bayes cho bi¸n ng¨u nhi¶n li¶n tục . . . . . . . . . 23 1.5 Phương ph¡p x½ch Markov Monte Carlo (MCMC) . . . . . . . . . . . . 24 1.5.1 Phương ph¡p Monter Carlo . . . . . . . . . . . . . . . . . . . . 24 1.5.2 Phương ph¡p x½ch Markov Monte Carlo (MCMC) . . . . . . . . 26 1.6 Gi£i thuªt Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.6.1 Bài to¡n sinh m¨u . . . . . . . . . . . . . . . . . . . . . . . . . 28 1.6.2 Thuªt to¡n Gibbs gi£i bài to¡n sinh m¨u . . . . . . . . . . . . . 29 2 Mô h¼nh ph£n hồi thời gian ùng đáp c¥u hỏi lognormal 33 2.1 Giới thi»u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.2 Mô h¼nh thời gian ph£n hồi lognormal IRT - LNIRT . . . . . . . . . . . 37 2.2.1 Gi£ thi¸t cõa mô h¼nh . . . . . . . . . . . . . . . . . . . . . . . 37 2.2.2 Mô h¼nh LNIRT . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.2.3 Mô h¼nh chu©n . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.3 Ước lượng tham sè . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.3.1 Ph¥n bè ti¶n nghi»m . . . . . . . . . . . . . . . . . . . . . . . . 45 2.3.2 Ph¥n bè hªu nghi»m . . . . . . . . . . . . . . . . . . . . . . . . 46 2.3.3 Gi£i thuªt Gibbs . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.3.4 Áp dụng gi£i thuªt Gibbs để ước lượng tham sè . . . . . . . . . 47 3
  6. MỤC LỤC 2.3.5 Độ phù hñp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3 Nghi¶n cùu thực nghi»m 50 3.1 Mô t£ m¨u . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.2 Ước lượng tham sè . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.3 Độ phù hñp cõa mô h¼nh . . . . . . . . . . . . . . . . . . . . . . . . . . 55 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO 60 4
  7. Danh s¡ch h¼nh v³ 1.1 Đường cong đặc trưng c¥u hỏi mô h¼nh mët tham sè [1] . . . . . . . . . 12 1.2 Vị tr½ độ khó cõa c¥u hỏi hoặc n«ng lực cõa th½ sinh tr¶n trục n«ng lực/độ khó tương ùng với x¡c su§t tr£ lời 0.5 [1]. . . . . . . . . . . . . . 13 1.3 Hàm đặc trưng c¥u hỏi cõa n«m c¥u hỏi trong mô h¼nh mët tham sè.[1] 13 1.4 Hàm đặc trưng cõa ba c¥u hỏi trong mô h¼nh hai tham sè.[1] . . . . . . 14 1.5 Hàm đặc trưng c¥u hỏi trong mô h¼nh ba tham sè.[1] . . . . . . . . . . 15 1.6 Hàm mªt độ x¡c su§t tu¥n theo ph¥n phèi chu©n. [wiki] . . . . . . . . . 16 1.7 Hàm mªt độ x¡c su§t tu¥n theo ph¥n phèi lognormal.wiki . . . . . . . . 19 1.8 Hàm ph¥n phèi x¡c su§t t½ch lũy tu¥n theo ph¥n phèi lognormal. [wiki] . 20 1.9 Minh họa thuªt to¡n Gibbs . . . . . . . . . . . . . . . . . . . . . . . . 31 1.10 Sơ đồ khèi gi£i thuªt Gibbs . . . . . . . . . . . . . . . . . . . . . . . . 32 2.1 Biºu đồ mi¶u t£ mô h¼nh ph¥n c§p cõa ph£n hồi và thời gian ph£n hồi (RT) trong c¡c c¥u hỏi cõa bài kiºm tra ở c¡p ti¸p cªn thù ba.[6] . . . . 36 2.2 V½ dụ hai ph²p t½nh sè học y¶u c¦u cường độ thời gian kh¡c nhau.[6] . . 39 2.3 Ảnh hưởng cõa tham sè ph¥n bi»t đối với ph¥n bè thời gian ph£n hồi (ph¦n tr¶n) và ph¥n bè ph£n hồi (ph¦n dưới). B¶n tr¡i là c¡c h¼nh với tham sè ph¥n bi»t có gi¡ trị nhỏ, ph¦n b¶n ph£i có tham sè ph¥n bi»t có gi¡ trị lớn hơn. Di»n t½ch ph¦n trùng nhau cõa hai ph¥n bè lớn hơn n¸u gi¡ trị tham sè ph¥n bi»t lớn hơn.[4] . . . . . . . . . . . . . . . . . 43 3.1 Biºu đồ ph¥n t¡n với trung b¼nh và phương sai cõa thời gian ph£n hồi t½nh theo gi¥y cho 48 c¥u (£nh tr¶n) và 2000 th½ sinh trong m¨u (£nh dưới).[4] ................................... 53 3.2 Ph¥n bè cõa thời gian ph£n hồi theo đơn vị gi¥y cõa c¥u hỏi 3 (h¼nh tr¶n; N=760) và c¥u hỏi 13 (h¼nh dưới; N=490).[4] . . . . . . . . . . . . 54 3.3 Ước lưñng cường độ thời gian (βi) và tham sè độ ph¥n bi»t (αi) trong mô h¼nh lô-ga-rít chu©n và mô h¼nh chu©n cho c£ hai trường hñp không [4] có ràng buôc và có ràng buëc cõa αi. . . . . . . . . . . . . . . . . . . 54 5
  8. DANH SÁCH HÌNH VẼ 3.4 Ph¥n bè cõa tham sè tèc độ (τi) đã ước lượng ở mô h¼nh lô-ga-r½t chu©n và mô h¼nh chu©n cho c£ hai trường hñp tham sè αi không có ràng buëc và có ràng buëc.[4] ............................. 55 3.5 Têng quan độ phù hñp cõa mô h¼nh lô-ga-rít chu©n và mô h¼nh chu©n cho c£ hai trường hñp tham sè αi không có ràng buëc và có ràng buëc. Càng phù hñp th¼ đường cong càng g¦n với đường th¯ng đơn vị y=x.[4] 56 3.6 Độ phù hñp cõa mô h¼nh lô-ga-rít chu©n cho c¥u hỏi tèt nh§t và c¥u hỏi t» nh§t với c£ hai trường hñp tham sè αi không có ràng buëc và có ràng buëc. Càng phù hñp th¼ đường cong càng g¦n với đường th¯ng đơn vị y=x[4] .................................... 56 6
  9. Danh s¡ch b£ng 1.1 Định nghĩa và c¡c gi¡ trị tu¥n theo ph¥n bè chu©n: X ∼ N(µ, σ2).[wiki] 16 1.2 Định nghĩa và c¡c gi¡ trị tu¥n theo ph¥n bè lognormal ln(X) ∼ N(µ, σ2): [wiki] ..................................... 19 3.1 Sè lượng c¥u hỏi cõa tøng th½ sinh trong m¨u.[4] . . . . . . . . . . . . . 52 3.2 Sè th½ sinh méi c¥u hỏi trong m¨u.[4] ................... 52 3.3 Tỷ l» quan s¡t được và tỷ l» kỳ vọng cõa th½ sinh có thời gian ph£n hồi nhỏ hơn ph¥n vị 5 và 10 trong ph¥n bè hªu nghi»m ở tøng trường hñp c¥u hỏi.[4] .................................. 57 3.4 Tỷ l» quan s¡t được và tỷ l» kỳ vọng cõa th½ sinh có thời gian ph£n hồi nhỏ hơn ph¥n vị 5 và 10 trong ph¥n bè hªu nghi»m ở tøng trường hñp c¥u hỏi.[4] .................................. 58 7
  10. Danh mục c¡c ký hi»u và chú vi¸t t­t Ω Không gian m¨u X; Y; Z::: Bi¸n ng¨u nhi¶n F (x);FX (x) Hàm ph¥n phèi t½ch lũy, hàm ph¥n phèi t½ch lũy cõa bi¸n ng¨u nhi¶n X p(x); pX (x) Hàm mªt độ x¡c su§t, hàm mªt độ x¡c su§t cõa bi¸n ng¨u nhi¶n X X 2 F Bi¸n ng¨u nhi¶n X có hàm ph¥n phèi t½ch lũy F C(FX ) Tªp c¡c hàm ph¥n phèi t½ch lũy li¶n tục E; EX K¼ vọng (gi¡ trị trung b¼nh), gi¡ trị k¼ vọng cõa bi¸n ng¨u nhi¶n X Var; VarX Phương sai, phương sai cõa bi¸n ng¨u nhi¶n X '(t);'X (t) Hàm đặc trưng, hàm đặc trưng cõa bi¸n ng¨u nhi¶n X X ∼ Y Bi¸n ng¨u nhi¶n X tương đương với bi¸n ng¨u nhi¶n Y Φ(x) Hàm ph¥n phèi chu©n t­c φ(x) Hàm mªt độ chu©n t­c N(µ, σ2) Ph¥n phèi chu©n N(0; 1) Ph¥n phèi chu©n t­c exp(a) Hàm e mũ ai Tham sè độ ph¥n bi»t cõa c¥u hỏi trong mô h¼nh IRT bi Tham sè độ khó cõa c¥u hỏi trong mô h¼nh IRT ci Tham sè x¡c su§t tr£ lời đúng ng¨u nhi¶n c¥u hỏi trong mô h¼nh IRT αi Tham sè độ dao động thời gian cõa c¥u hỏi trong mô h¼nh LNIRT βi Tham sè cường độ thời gian cõa c¥u hỏi trong mô h¼nh LNIRT exp(a) Hàm e mũ 8