Tiếng kẻng an ninh

Nhằm phòng chống trộm cắp tội phạm ở địa phương UBND xã đã phát động phong trào “tiếng kẻng an ninh” để mỗi khi người dân phát giác tội phạm dùng tiếng kẻng để kêu gọi mọi người trong thôn tham gia truy bắt tội phạm.

Tiếng kẻng anh ninh được làm bằng ống tre, cây tre chọn làm kẻng được chọn lọc kỹ càng tre phải to ống và phải già như vậy khi làm kẻng thì đánh vào thì tiếng kẻng phát ra âm thanh to và vang vọng. Ống tre làm kẻng được cưa lấy mắc bằng 2 đầu chuốt mắc cho mượt sau đó khoét một lỗ nhỏ và dài dọc theo ống nhằm khi gõ kẻng phát ra âm vang xa hơn ngoài ra có cái lỗ như vậy để tiện cất giữ dùi đánh kẻng. Hai đầu ống tre buộc một sợi dây để tiện lúc mang kẻng khi đánh và truy bắt tội phạm.

Dùi kẻng cũng làm bằng tre yêu cầu phải là gốc tre như vậy thì cái dùi kẻng mới rắn chắc đánh vào kẻng mới kêu to và vọng. Thanh tre được cắt ngắn tầm 3 gang tay sau đó chuốt cho tròn không to cũng không nhỏ quá, theo quan sát của tôi cái dùi kẻng tôi chụp được nhà hàng xóm thì to bằng ngón tay cái người lớn.

Song song với kẻng thì có một sợi dây dừa tầm khoản 2m đề phòng khi bắt được tội phạm thì dùng dây này để trói tội phạm chờ Công an địa phương tới xử lý.

Để người dân thuần thục việc dùng kẻng UBND xã tổ chức một đợt tập huống trong thôn. Tình huống giả định là vào khoản 10h tối một kẻ trộm đột nhập vào chuồng heo để bắt trộm gà nhà bà Ba. Nghe tiếng gà quát lên bà Ba liền dùng kẻng gõ báo trộm kêu gọi sự giúp đỡ của hàng xóm. Khi nghe được tiếng kẻng phát ra từ nhà bà Ba cả xóm đều tỉnh giấc người người mang kẻng ra đường đánh thức cả xóm dậy dùng kẻng đánh inh tai, cuối cùng một hồi đánh kẻng thì kẻ trộm mặt dù là giả định nhưng cũng được chạy thoát.

Hy vọng với tiếng kẻng an ninh này quê tôi bớt đi trộm vặt.

NTDSC_0732

DSC_0733DSC_0734

Cách viết một bài báo khoa học – Phần 3

Cách viết một bài báo khoa học – Phần 1

Cách viết một bài báo khoa học – Phần 2

Có lẽ phần quan trọng nhất của một bài báo khoa học là phần phương pháp. Kinh nghiệm làm biên tập của tôi cho thấy tập san tôi tham gia phụ trách trong ban biên tập (tập san Journal of Bone and Mineral Research) từ chối khoảng 75% những bài báo gửi đến; trong số bài báo bị từ chối, gần 70% là do khiếm khuyết trong phần phương pháp. Tôi đã thấy và đọc rất nhiều bài báo gửi đến cho tập san mà kết quả rất thú vị, nhưng đành phải từ chối vì phần phương pháp được mô tả quá sơ sài, hay mô tả một cách xem thường người đọc.

Có thể tác giả không có ý xem thường ai, nhưng vì cách viết và trình bày chưa đạt chuẩn mực nên gây ra ấn tượng đó. Trong phần 3 này, tôi sẽ chỉ các bạn viết phần phương pháp một cách chuẩn mực và chắc chắn sẽ không bị ai phê bình là … viết dở. 🙂

Phương pháp (Methods)

Phần phương pháp nghiên cứu có lẽ là phần quan trọng nhất trong một bài báo khoa học. Khoảng 70% bài báo khoa học bị từ chối chỉ vì phương pháp nghiên cứu không thích hợp hay sai lầm. Nhiều người đọc có thói quen đọc phương pháp trước, rồi sau đó họ đọc các phần khác. Nếu họ thấy phương pháp nghiên cứu có chất lượng, họ sẽ đọc tiếp; nếu không, họ sẽ bỏ qua một bên! Do đó, đây là phần mà tác giả cần phải đầu tư nhiều thì giờ để viết cho “đạt”.

Trong phần phương pháp, tác giả phải trả lời cho được câu hỏi: “tác giả đã làm gì” (Whatdid you do?) Để trả lời câu hỏi này, tác giả phải cung cấp thông tin về thiết kế nghiên cứu, bệnh nhân (hay đối tượng nghiên cứu), phương pháp đo lường, độ tin cậy và chính xác của đo lường, phương pháp phân tích dữ liệu. Do đó, phần phương pháp nghiên cứu có thể có những tiêu đề nhỏ như sau:

Thiết kế nghiên cứu (studydesign). Phát biểu ngằn gọn về mô hình nghiên cứu. Đây là câu văn đơn giản, nhưng nói lên giá trị khoa học của công trình nghiên cứu. Ví dụ: “The study was designed as a cross- sectional investigation, in which 210 women aged between 50 and 85 were randomly sampled by the cluster sampling scheme.”

Đối tượng tham gia (Participants). Thông tin về đặc điểm của đối tượng nghiên cứu đóng vai trò quan trọng để người đọc có thể đánh giá khả năng khái quát hóa của công trình nghiên cứu. Khi mô tả đặc điểm đối tượng nghiên cứu, tiêu chuẩn tuyển chọn và tiêu chuẩn loại. Đôi khi tác giả cần phải các biến số quan trọng như độ tuổi, giới tính, sắc tộc, trình độ học vấn, tình trạng sức khỏe. Ví dụ: “All women requesting an IUCD (intrauterine contraceptive device) at the Family Welfare Clinic, Kenyatta National Hospital, who were menstruating regularly and who were between 20 and 44 years of age, were candidates for inclusion in the study. They were not admitted to the study if any of the following criteria were present: (1) a history of ectopic pregnancy, (2) pregnancy within the past 42 days, (3) leiomyomata of the uterus, (4) active PID (pelvic inflammatory disease), (5) a cervical or endometrial malignancy, (6) a known hypersensitivity to tetracyclines, (7) use of any antibiotics within the past 14 days or long-acting injectable penicillin, (8) an impaired response to infection, or (9) residence outside the city of Nairobi, insufficient address for follow-up, or unwillingness to return for follow-up.”

Địa điểm và bối cảnh nghiên cứu (setting). Cần phải cung cấp thông tin về địa điểm mà công trình nghiên cứu được thực hiện, hay nơi mà dữ liệu được thu thập, bởi vì địa điểm có thể ảnh hưởng đến tính hợp lí ngoại tại của kết quả nghiên cứu. Chẳng hạn như khi chúng tôi làm nghiên cứu về vitamin D, chúng tôi phải cung cấp thông tin về thành phố mà mình thực hiện công trình nghiên cứu. Ví dụ: “The study was designed as a cross-sectional investigation, in which the setting was Ho Chi Minh City (formerly Saigon). The City is located at 10°45’N, 106°40’E in the southeastern region of Vietnam. The City is in the tropic and close to the sea; therefore it has a tropical climate, with an average humidity of 75%. There are only two distinct seasons: the rainy season, with an average rainfall of about 1,800 millimetres annually (about 150 rainy days per year), usually begins in May and ends in late November; the dry season lasts from December to April. The average temperature is 28°C (82°F), the highest temperature sometimes reaches 39°C (102°F) around noon in late April, while the lowest may fall below 16°C (61°F) in the early mornings of late December.”

Qui trình nghiên cứu (Procedures). Trong phần này, tác giả phải tóm lược từng bước nghiên cứu, kể cả những chỉ dẫn cho đối tượng nghiên cứu như thế nào. Việc phân nhóm trong nghiên cứu, chi tiết về can thiệp hay điều trị (nếu có). Nếu công trình có liên quan đến ngẫu nhiên hóa, tác giả cần phải mô tả cụ thể qui trình ngẫu nhiên hóa (randomization) như thế nào, kĩ thuật gì đã được sử dụng để đảm bảo các nhóm cân đối,

v.v…

Ví dụ: Patients with psoriatic arthritis were randomized to receive placebo or etanercept (Enbrel) at a dose of 25 mg twice weekly by subcutaneous administration for 12 weeks … Etanercept was supplied as a sterile, lyophilized powder in vials containing 25 mg etanercept, 40 mg mannitol, 10 mg sucrose, and 1-2 mg tromethamine per vial. Placebo was identically supplied and formulated except that it contained no etanercept. Each vial was reconstituted with 1 mL bacteriostatic water for injection.

Ngoài ra, tác giả phải mô tả cẩn thận kĩ thuật đo lường được sử dụng trong nghiên cứu, như tên của máy, model gì, software phiên bản nào, và nơi sản xuất. Cần phải mô tả điều kiện (nhiệt độ, ánh sáng) trong khi đo lường, cũng như các hệ số về độ tin cậy và độ chính xác của kĩ thuật đo lường.

Ví dụ: Blood pressure (diastolic phase 5) while patient was sitting and had rested for at least five minutes was measured by a trained nurse with a Copal UA-251 or a Takeda UA-751 electronic ausculatory blood pressure reading machine (Andrew Stephens, Brighouse, West Yorkshire) or with a Hawksley random zero sphygmomanometer (Hawksley, Lancing, Sussex) in patients with atrial fibrillation. The first reading was discarded and the mean of the next three consecutive readings with a coefficient of variation below 15% was used in the study, with additional readings if required.

Định nghĩa chỉ tiêu lâm sàng (measurements of endpoints). Một công trình nghiên cứu lâm sàng phải có một endpoint hay outcome, mà tôi tạm dịch là “chỉ tiêu lâm sàng”, là cái làm thước đo của một thuật can thiệp. Do đó, tác giả cẩn phải định nghĩa rõ ràng chỉ tiêu lâm sàng của công trình nghiên cứu là gì, và nhất là phương pháp đo lường (như vừa đề cập) ra sao. Thông thường, một nghiên cứu có 2 chỉ tiêu lâm sàng mà tiếng Anh gọi là “primary endpoint” (chỉ tiêu chính) và “secondary endpoint” (chỉ tiêu phụ).

Ví dụ: The primary endpoint with respect to efficacy in psoriasis was the proportion of patients achieving a 75% improvement in psoriasis activity from baseline to 12 weeks as measured by the PASI (psoriasis area and severity index). Additional analyses were done on the percentage change in PASI scores and improvements in target psoriasis lesions.

Nên nhớ rằng ở phần này tác giả chỉ mô tả những biến có liên quan đến bài báo, chứ không phải mô tả tất cả những biến đã được thu thập trong công trình nghiên cứu. Chẳng hạn như nếu bài báo chỉ nói về mật độ xương, thì tác giả không cần phải nói đến gãy xương (vì hai biến này rất khác nhau). Nguyên tắc là: chỉ mô tả những gì có liên quan đến phần kết quả.

Cỡ mẫu (Sample Size). Cỡ mẫu là một yếu tố rất quan trọng trong một nghiên cứu lâm sàng. Thông thường, các nghiên cứu randomized controlled trial (RCT) phải có một câu văn mô tả cách tính cỡ mẫu. Không phải là công thức tính (như tôi thấy nhiều bài báo ở Việt Nam), mà là những giả định đằng sau cách tính. Điều này quan trọng, vì qua giả định, người đọc có thể đánh giá khả năng mà công trình nghiên cứu có thể giải quyết câu hỏi đặt ra trong phần dẫn nhập.

Ví dụ: We consider that the incidence of symptomatic deep venous thrombosis or pulmonary embolism or death would be 4% in the placebo group and 1.5% in the ardeparin sodium group. Based on 0.9 power to detect a significant difference (p 0.05, two-sided), 976 patients were required for each study group. To compensate for nonevaluable patients, we planned to enroll 1000 patients in each group.

Ngẫu nhiên hóa (Randomization). Trong các công trình nghiên cứu lâm sàng đối chứng ngẫu nhiên (randomized controlled trial hay RCT), bệnh nhân thường được phân nhóm một cách ngẫu nhiên. Có nhiều cách phân nhóm bằng máy tính và thuật toán, cho nên tác giả có trách nhiệm phải mô tả rõ phương pháp phân nhóm để người đọc có thế đánh giá chất lượng của nghiên cứu. Nếu cách phân nhóm có hiệu quả thì kết quả thường cho thấy các nhóm rất tương đương về các đặc tính lâm sàng. Một ví dụ về cách mô tả phương pháp phân nhóm có thể thấy trong đoạn văn sau đây: “Women had an equal probability of assignment to the groups. The randomization code was developed using a computer random number generator to select random permuted blocks. The block lengths were 4, 8, and 10 varied randomly.”

Mật hóa (còn gọi là Blinding). Trong các công trình RCT, có khi cả bác sĩ điều trị và bệnh nhân đều không biết bệnh nhân mình (hay mình) nằm trong nhóm nào của nghiên cứu. Đây là một biện pháp nhằm tăng tính khách quan khi đánh giá hiệu quả của can thiệp. Cũng như ngẫu nhiên hóa có thể thực hiện bằng nhiều thuật toán, cách mật hóa cũng có thể thực hiện bằng nhiều “thủ thuật”. Cách mô tả thủ thuật đó có thể tìm thấy trong đoạn văn sau đây:: “All study personnel and participants were blinded to treatment assignment for the duration of the study. Only the study statisticians and the data monitoring committee saw unblinded data but none had any contact with study participants.”

Phân tích dữ liệu (DataAnalysis). Thiết kế và phân tích các nghiên cứu lâm sàng đều cần đến các phương pháp thống kê. Do đó, phần này tuy là phần cuối trong phần phương pháp của bài báo khoa học, nhưng nó đóng vai trò rất quan trọng. Tôi từng phục vụ trong ban biên tập và thấy rất nhiều bài báo và công trình nghiên cứu rất tốt nhưng vì phân tích sai nên đành phải từ chối. Con số bài báo bị từ chối vì phân tích sai có khi lên đến 50% (như với tập san JAMA chẳng hạn). Do đó, trong phần phân tích, tác giả phải phát biểu cho được biến phụ thuộc (hay endpoints hoặc outcome) là gì, biến độc lập (hay risk factors hoặc covariates) là gì, và định nghĩa rõ ràng các biến này được xử lí ra sao. Nếu số liệu đã qua hoán chuyển thì tác giả phải giải thích tại sao. Vì có nhiều phương pháp phân tích số liệu và kiểm định giả thuyết, nên tác giả còn phải giải thích tại sao đã chọn phương pháp A mà không là phương pháp B. Đôi khi tác giả cũng phải nói ra đã dùng software nào cho phân tích. (Nhớ đừng “khoe” software phân tích mà cơ quan hay cá nhân đã “tậu” một cách bất hợp pháp!)

Ví dụ về cách viết đoạn văn này như sau: “All data analysis was carried out according to a pre-established analysis plan. Proportions were compared by using Chi-squared tests with continuity correction or Fisher’s exact test when appropriate. Multivariate analyses were conducted with logistic regression. The durations of episodes and signs of disease were compared by using proportional hazards regression. Mean serum retinol concentrations were compared by t-test and analysis of covariance … Two-sided significance tests were used throughout. The analysis was performed with the SAS system (SAS Institute, Inc, Cary, NC, USA.”

Nói chung, phần Phương pháp thường dài gấp 2 hay 3 lần phần Dẫn nhập. Sẽ không có vấn đề gì nếu tác giả mô tả phần Phương pháp một cách chi tiết, vì nếu tập san thấy không cần thiết thì họ sẽ cắt bỏ hay đưa vào phần phụ chú (appendix). Nhưng sẽ là vấn đề nếu tác giả cố tình mô tả phần Phương pháp một cách mù mờ và vắn tắt, bởi vì người duyệt bài sẽ nghĩ tác giả hoặc là muốn dấu diếm vấn đề hoặc là thiếu thành thật! Xin nhắc lại rằng gần 70% bài báo khoa học bị từ chối là do phương pháp không đúng hay mô tả không đầy đủ. Vì thế, tác giả cần phải hết sức thận trọng trong phần mô tả Phương pháp nghiên cứu, làm sao nói cho được là “what did you do” (bạn đã làm gì trong nghiên cứu này).

Trong các phần kế tiếp, tôi sẽ chỉ cách viết phần kết quả và mô tả các dữ liệu. Thể theo yêu cầu của nhiều bạn đọc, tôi cũng sẽ cố gắng chỉ ra những chữ, câu văn, những đoạn văn quen thuộc trong cách viết một bài báo khoa học. Tôi nghĩ những chữ, câu văn và đoạn văn đặc thù này sẽ rất có ích cho các bạn đang muốn hay trong quá trình “phải có danh gì với núi sông” (tức là công bố cho được một vài bài báo khoa học để lưu danh cùng hậu thế :-)).

Nguyễn Văn Tuấn

Cách viết một bài báo khoa học – Phần 2

Cách viết một bài báo khoa học – Phần 1

Cách viết một bài báo khoa học – Phần 2

GS Nguyễn Văn Tuấn

Tuần qua tôi đã bàn về cách đặt tựa đề bài báo và các viết một abstract; tuần này, tôi sẽ chỉ cách viết phần dẫn nhập (introduction hay background). Phần dẫn nhập là phần tương đối quan trọng, vì nó nói lên kiến thức của tác giả đến đâu trong chuyên ngành. Người kinh nghiệm chỉ cần đọc qua phần dẫn nhập có thể đánh giá sơ qua về khả năng của tác giả đến đâu, có cập nhật hóa kiến thức như thế nào, và kĩ năng viết lách ra sao (chỉ nhìn qua cách dùng thuật ngữ là có thể đoán được).

Do đó, tác giả cần phải nhân cơ hội viết phần dẫn nhập để thuyết phục người đọc và chứng minh cho họ thấy rằng mình cũng “biết câu chuyện”. Tôi sẽ lấy vài ví dụ để minh họa cho phần này, và để giữ khách quan, tôi sẽ không nêu tên tác giả.

Dẫn nhập (introduction)

Trong phần này, tác giả cẩn phải trả lời câu hỏi “Tạisaolàm nghiên cứu này?” (Why did you do this study?) Phần dẫn nhập phải cung cấp những thông tin sau đây: (a) định nghĩa vấn đề; (b) những gì đã được làm để giải quyết vấn đề; (c) tóm lược những kết quả trước đã được công bố trong y văn; (d) và mục đích của nghiên cứu này là gì.

Đối với các tập san y khoa lớn và tổng quát (như New England Journal of Medicine, JAMA, Annals of Internal Medicine, v.v…) thì định nghĩa vấn đề rất quan trọng, bởi vì độc giả khác ngành có thể nắm được vấn đề và biết được tác giả đứng trên góc độ nào. Chẳng hạn như một nghiên cứu về gene và loãng xương, thì đoạn đầu tiên có thể nên (a) định nghĩa loãng xương là gì (vì nhiều người vẫn chưa rành), (b) tầm quan trọng của loãng xương ra sao (câu này để nhấn mạnh đây là vấn đề lớn, và vì lớn nên phải công bố trên các tập san lớn!) Chẳng hạn như, tác giả có thể viết “Osteoporosis is a disease characterized by low bone mass and deteriorated bone architecture which ultimately lead to increased susceptibility of fragility fracture.” Câu kế tiếp sẽ nói tầm quan trọng của gãy xương như thế nào, như tăng nguy cơ tử vong, tái gãy xương, giảm chất lượng cuộc sống,

v.v… Nhưng đối với các tập san chuyên ngành loãng xương và nội tiết, thì câu định nghĩa trên có khi … khôi hài. Khôi hài là vì đại đa số độc giả các tập san đó đều biết loãng xương là gì, và họ sẽ thấy khó chịu nếu tác giả “lên lớp” họ về một định nghĩa sơ đẳng! Thông thường, những tác giả viết câu định nghĩa trong các tập san chuyên ngành là nghiên cứu sinh, chứ chuyên gia cấp cao hơn không ai viết như thế.

Trong phần dẫn nhập, tác giả cần phải nêu cho được tầm quan trọng của vấn đề nghiên cứu. Để nêu tầm quan trọng, tác giả có thể trình bày những thông tin như tần số của bệnh (prevalence) trong cộng đồng, hệ quả của bệnh đến nguy cơ tử vong, tăng nguy cơ mắc các bệnh khác (biến chứng), ảnh hưởng của bệnh đến nền kinh tế nước nhà, giảm chất lượng cuộc sống. Chẳng hạn như câu “In postmenopausal women, one in three women will sustain a fragility fracture during their remaining lifetime” là một cách nêu lên qui mô của vấn đề gãy xương; nhưng để nêu hệ quả thì có thể viết một câu khác như “Fragility fracture is associated with increased risk of pre-mature mortality” (câu này nhấn mạnh “pre-mature mortality”, tức là chết sớm!) nên sẽ gây chú ý.

Trong phần điểm qua y văn, tác giả cần phải trình bày những thông tin cơ bản để cho người đọc nắm được vấn đề, ý nghĩa và tầm quan trọng của vấn đề, và hiểu mục tiêu của công trình nghiên cứu. Chỉ nên trình bày những thông tin có liên quan trực tiếp đến vấn đề, chứ không nên điểm qua những thông tin gián tiếp.

Phần lớn những ý tưởng trong phần dẫn nhập xuất phát từ y văn, tức những công trình đã công bố trước đây. Khi điểm qua y văn, nên giới hạn trong những nghiên cứu đã công bố trong vòng 5 năm trở lại đây, tránh những nghiên cứu đã trên 20 năm hay tránh những thông tin trong sách giáo khoa vì có thể những thông tin như thế không còn hợp thời nữa. Tuy trình bày thông tin quá khứ, nhưng phải là những câu chữ của chính tác giả, chứ không phải trích dẫn quá nhiều hay lặp lại câu chữ của người đi trước. Tất cả những thông tin trong phần dẫn nhập phải ăn khớp với tài liệu tham khảo. Tác giả nên có những tài liệu tham khảo đó, chứ không nên trích dẫn theo những những bài báo trong y văn (secondary citation).

Cách viết

Về mặt cấu trúc, phần dẫn nhập bao gồm một số đoạn văn không cần tiêu đề (heading). Tuy nhiên, để viết tốt phần dẫn nhập, kinh nghiệm của tôi cho thấy cần phải chú ý đến một số điểm căn bản sau đây:

(a) Khôngnênviết quá dài. Viết quá dài rất dễ làm cho người đọc sao lãng vấn đề chính, và có khi làm mất thì giờ người đọc phải đọc những thông tin không cần thiết.

(b) Khôngnênđiểmqua y văn theo kiểu viết sử. Phần lớn những người đọc bài báo là đồng nghiệp chúng ta, cho nên họ đã có một số kiến thức cơ bản. Do đó, tác giả không cần phải điểm qua y văn từ thời Hippocrate hay Khổng Tử, cũng không cần phải “lên lớp” [hay khoe với] người đọc về những khái niệm cơ bản mà người làm trong ngành phải biết. Một điều quan trọng là những thông tin trình bày trong phần dẫn nhập phải có liên quan đến vấn đề nghiên cứu.

(c) Phần dẫn nhập phải phát biểu mục đích nghiên cứu. Đoạn văn cuối của phần dẫn nhập là nơi để tác giả, sau khi điểm qua vấn đề và y văn, phát biểu mục đích của công trình nghiên cứu. Cố gắng duy trì nguyên tắc “từ tổng quan đến cụ thể”, tức là trong phần phát biểu vấn đề thì câu văn mang tính chung chung, nhưng phần mục đích thì phải cụ thể. Trong nhiều trường hợp, trước phần mục đích, tác giả nên phát biểu giả thuyết nghiên cứu. Chẳng hạn như “We hypothesize that blah blah blah”, rồi một câu kế tiếp “This study was designed to test the hypothesis by addressing the following specific aims: blah blah blah”.

(d) Vềvănphạm, phần dẫn nhập nên viết bằng thì quá khứ, nhất là khi mô tả những kết quả trong quá khứ. Tuy nhiên, khi đề cập đến những thông tin mang tính cổ điển mà được cộng đồng chuyên ngành chấp nhận, tác giả có thể dùng thì hiện tại.

Một số ví dụ

Trong bài báo sau đây (link bài báo được tác giả trích dẫn không tồn tại nên tôi không đăng được ở đây- NT) , tác giả viết phần dẫn nhập một cách ngắn gọn, chỉ 1 đoạn văn, nhưng cung cấp đầy đủ thông tin cần thiết để bạn đọc biết vấn đề.

Fragility fracture is a serious public health problem, because it is prevalent in the elderly and is associated with increased risk of mortality [1]. Measurement of bone mineral density predicts subsequent risk of fractures among the elderly [2-4]. However, bone mineral density in later decades of life is a dynamic function of peak bone mass achieved during growth and its subsequent age-related rate of loss [5]. It has been estimated that over a lifetime, a typical woman loses about half of her trabecular bone and one third of her

cortical bone [6], although some women experience greater loss than others.

It is not clear whether the rate of bone loss is an independent risk factor for osteoporotic fractures. We hypothesized that patients with excessive bone loss are at increased risk of fracture. The present study was designed to test the hypothesis by assessing the contribution of bone loss to the risk of osteoporotic fractures in elderly women

Câu đầu (Fragility fracture is a serious public health problem, because it is prevalent in the elderly and is associated with increased risk of mortality) tác giả định nghĩa vấn đề và cố gắng thuyết phục rằng gãy xương là vấn đề nghiêm trọng vì làm tăng nguy cơ tử vong.

Trong câu thứ hai (Measurement of bone mineral density predicts subsequent risk of fractures among the elderly) tác giả cho biết mật độ xương là một yếu tố tiên lượng gãy xương.

Hai câu kế tiếp (However, bone mineral density in later decades of life is a dynamic function of peak bone mass achieved during growth and its subsequent age-related rate of loss. It has been estimated that over a lifetime, a typical woman loses about half of her trabecular bone and one third of her cortical bone [4], although some women experience greater loss than others) tác giả cho biết mật độ xương thay đổi thay độ tuổi, và tùy thuộc vào hai thông số: mật độ xương tối đa trong thời “xuân thì”, và tỉ lệ mất xương sau thời kì mãn kinh.

Câu kế tiếp tác giả cung cấp thông tin cụ thể hơn, cho biết một phụ nữ trung bình mất khoảng 50% xương xốp và 1/3 xương đặc, và tỉ lệ mất xương dao động lớn giữa các phụ nữ. Câu văn thứ tư (It is not clear whether the rate of bone loss is an independent risk factor for osteoporotic fractures) cho chúng ta biết khoảng trống trong y văn: đó là chưa ai biết tỉ lệ mất xương có liên quan gì đến gãy xương hay không.

Sau khi đặt vấn đề, tác giả phát biểu giả thuyết nghiên cứu (We hypothesized that patients with excessive bone loss are at increased risk of fracture), và mục đích nghiên cứu (The present study was designed to assess the contribution of bone loss to the risk of osteoporotic fractures in elderly women.)

Đây là một dẫn nhập có thể nói là rất logic, vì ý tưởng nối kết nhau. Câu văn đầu cho đến câu văn cuối là một vòng tròn khép kín. Có lẽ cái hay của tác giả là chỉ tóm gọn phần dẫn nhập trong một đoạn văn duy nhất với 114 từ! Viết dẫn nhập ngắn gọn và súc tích như thế đòi hỏi kinh nghiệm chuyên môn tốt và cách dùng chữ một cách chiến lược.

Nhưng nếu chúng ta xem xét phần dẫn nhập sau đây:

It is well recognised that nonsocomial infection is associated with an increase in morbidity and mortality

together with a significant economic cost [1]. Patients in Intensive Care units develops nonsocomial infections more frequently than other hospitalised patients [2].

This is a result of severity of illness, multiple exposure to invasive procedures and multiple therapies [3]. Patients in surgical and orthopaedic wards are also at a high risk of developing nonsocomial infections.

These patients are exposed to various invasive procedures (including surgical wounds) which may be similar to those in ICU. Because of the expected differences in the nature of risk factors, patients’ illnesses in the therapeutic and infection control measures in the above wards, it was necessary to conduct a study to assess the nonsocomial infection rates.

Cách viết này không tệ, nhưng khó có thể xem là tốt. Câu văn đầu tiên (It is well recognised that nonsocomial infection is associated with an increase in morbidity and mortality together with a significant economic cost [1]) tác giả cho biết vấn đề quan trọng vì liên quan đến tử vong và tốn kém. Những câu văn sau, tác giả cố gắng giải thích vấn đề nhiễm trùng ở bệnh nhân cấp cứu và bệnh nhân qua phẫu thuật chấn thương chỉnh hình, mà họ nghĩ rằng có cùng nguy cơ. Tuy nhiên, tác giả không cho biết vấn đề là gì, đã có ai nghiên cứu gì, và khoảng trống của tri thức là gì. Ấy thế mà đến câu văn kế tiếp, tác giả giải thích lí do cho nghiên cứu! (Because of the expected differences in the nature of risk factors, patients’ illnesses in the therapeutic and infection control measures in the above wards, it was necessary to conduct a study to assess the nonsocomial infection rates). Thật ra, mục đích nghiên cứu cũng chưa rõ ràng, vì tác giả không phát biểu giả thuyết làm nền tảng cho nghiên cứu là gì. Sau khi đọc xong phần dẫn nhập, có lẽ người đọc không biết ý nghĩa và tầm quan trọng của nghiên cứu này ra sao. Thật vậy, tác giả chưa thuyết phục độc giả tại sao họ đã thực hiện công trình nghiên cứu! Nên tránh cách viết như thế này.

Đoạn văn dưới đây cũng là phần dẫn nhập của một bài báo trên một tập san toán ở Việt Nam. Bài báo này thật ra không phải là một công trình nghiên cứu toán, mà là một bài viết về lịch sử phát triển bộ môn toán có tên là “complex analysis” (chưa biết dịch sang tiếng Việt là gì) ở Việt Nam.

In the development of contemporary mathematics in Vietnam complex analysis occupies a special place. In this note we give a brief survey of the development of complex analysis in Vietnam. We describe how complex analysis in Vietnam developed under very special conditions: the anti-French resistance, the struggle for the reunification of the country, the American war, the economic crisis, and the change toward a market economy.

Đứng trên quan điểm viết báo khoa học, phần dẫn nhập này chưa đạt. Tạm bỏ qua những sai sót về tiếng Anh và văn phạm tiếng Anh (khá hiển nhiên), có thể thấy rằng các câu văn không mang tính nối tiếp và khúc chiếc. Trong câu văn đầu, tác giả không nêu vấn đề là gì, mà đi thẳng vào vị trí đặc biệt của complex analysis ở Việt Nam. Nhưng câu thứ hai thì không thấy tac giả nói “đặc biệt” như thế nào; thay vào đó, tác

giả giới thiệu nội dung bài viết! Đến câu thứ 3 thì chúng ta mới biết “đặc biệt” là gì (là phát triển trong bối cảnh chiến tranh). Nói cách khác, phần dẫn nhập này chưa đạt, vì chưa nói lên được vấn đề, chưa trả lời câu hỏi tại sao phải có bài báo này. Cách trình bày ý tưởng cũng chưa mạch lạc. Nên tránh cách viết này.

Có người nghĩ rằng chỉ cần viết ngắn gọn, nhưng đối với “văn chương khoa học” thì tôi nghĩ quan điểm đó không đúng. Viết phần dẫn nhập quá ngắn làm cho người đọc cảm nhận rằng tác giả thiếu suy nghĩ sâu, thiếu ý tưởng, hay thiếu thông tin (nên chẳng biết viết/nói gì thêm). Viết dài quá thì độc giả lại nghĩ tác giả có lẽ

do thiếu ý tưởng nên cố tình kéo dài câu chuyện! Do đó, cách viết dẫn nhập tốt nhất là vừa đủ, không qúa dài và cũng không quá ngắn. Theo kinh nghiệm của tôi, phần dẫn nhập của một bài báo y khoa chỉ nên giới hạn trong vòng 1 trang A4. Điều quan trọng nhất là sau khi đọc xong phần dẫn nhập, người đọc biết được tầm quan trọng của nghiên cứu, và tại sao tác giả làm nghiên cứu. Được như thế thì có thể xem như tác giả đã “đạt” được một mục tiêu của mình: đó là làm cho người đọc phải đọc phần kế tiếp (phần Phương pháp).

Những sai lầm phổ biến trong phân tích thống kê Phần 2

Tiếp tục bài trước về những sai sót trong phân tích dữ liệu. Bài này tập trung vào những sai sót về sự chia nhóm tùy tiện, sử dụng sai độ lệch chuẩn và sai số chuẩn.

Sai sót 3: Phân chia biến liên tục thành nhiều nhóm mà không giải thích lí do

Thỉnh thoảng, để đơn giản hóa các phân tích thống kê, nhà nghiên cứu có thể chia các biến liên tục thành nhiều nhóm. Chẳng hạn như body mass index có thể chia thành 4 nhóm: béo phì, quá cân, bình thường, và thiếu cân. Nhưng cũng có nhiều trường hợp nhà nghiên cứu chia nhóm một cách tùy tiện, hoàn toàn không theo một qui ước lâm sàng nào cả, như chia độ tuổi thành nhiều nhóm theo 5 tuổi (0-4, 5-9, 10-14, v.v.), lại có khi chia thành nhóm theo 10 tuổi (0-9, 10-19, 20-29, v.v.). Phân chia một biến liên tục thành một biến không liên tục qua phân nhóm như vừa đề cập là một cách làm … phi khoa học. Như đề cập trên, biến liên tục là biến có giá trị chính xác cao nhất so với các biến định cấp và định danh. Một khi một biến liên tục bị cắt thành nhiều đoạn, thì điều đó cũng có nghĩa là làm giảm độ chính xác của biến số. Vì độ chính xác suy giảm, nên power của phân tích cũng giảm theo. Đã có rất nhiều nghiên cứu lí thuyết và thực hành cho thấy những phân nhóm như thế là phản khoa học, và có khi cho ra những kết quả rất khó diễn giải, nếu không muốn nói là sai.

Sai sót 4: Dùng trung bình và độ lệch chuẩn (SD) để mô tả một biến liên tục không tuân theo luật phân phối chuẩn

Không như các biến định danh và định cấp vốn có thể mô tả bằng tần số (frequency) hoặc tỉ lệ (proportion) cho mỗi nhóm, các biến số liên tục có thể mô tả bằng một biểu đồ phân phối. Đối với các biến tuân theo luật phân phối chuẩn (normal distribution), có hai thông số chính là số trung bình và độ lệch chuẩn. Theo định nghĩa của luật phân phối chuẩn, khoảng 67% các giá trị của nằm trong khoảng ±1 SD của số trung bình; khoảng 95% giá trị nằm trong khoảng ± 2 SD.

Tuy nhiên, nếu một biến không tuân theo luật phân phối chuẩn, thì số trung bình và độ lệch chuẩn sẽ không có ý nghĩa gì đáng kể. Đối với các biến không tuân theo luật phân phối chuẩn, các suy luận về 67% và 95% không còn đúng nữa. Trong trường hợp này, chúng ta nên dùng số trung vị (median) và số interquartile range để mô tả dữ liệu.

Phần lớn số liệu lâm sàng và sinh hóa không tuân theo luật phân phối chuẩn. Do đó, số trung vị và interquartile range nên được sử dụng thường xuyên hơn. Một cách tính nhẩm đáng tin cậy là nếu SD cao hơn phân nửa số trung bình (và số âm là số không khả dĩ về mặt sinh học) thì dữ liệu có lẽ không tuân theo luật phân phối chuẩn.

Sai sót 5: Dùng số trung bình và sai số chuẩn (standard error – SE) như là các chỉ số thống kê mô tả

Số trung bình và độ lệch chuẩn (SD) là những chỉ số thống kê mô tả một mẫu nghiên cứu (study sample) với điều kiện biến số tuân theo luật phân phối chuẩn. Sai số chuẩn (standard error hay SE) là một chỉ số đo lường độ chính xác (precision) của một đặc điểm quần thể (population). Xin nhắc lại, SD áp dụng một mẫu nghiên cứu, SE áp dụng cho đặc điểm của một quần thể. SD phản ảnh độ dao động hay khác biệt giữa các cá nhân trong một mẫu nghiên cứu, còn SE phản ảnh độ dao động về một chỉ số như số trung bình giữa các mẫu tưởng tượng (vâng! tưởng tượng).

SE có thể ước tính từ SD bằng cách lấy SD chia cho căn số bậc hai của số cỡ mẫu. Do đó, SE lúc nào cũng thấp hơn SD. Nhiều nhà nghiên cứu không hiểu ý nghĩa của SE nên dùng nó như là một đo lường thay cho SD, và làm cho biến số có độ dao động thấp hơn so với thực tế. Một số nhà nghiên cứu sai lầm vì không hiểu (tức sai lầm có thể thông cảm), nhưng có những nhà nghiên cứu cao bồi cố tình lừa gạt người đọc bằng cách dùng SE thay cho SD và không nói rõ. Nói chung, nên dùng SD (chứ không phải SE) để mô tả một biến số.

Nguyễn Văn Tuấn

Còn tiếp …

Những sai lầm phổ biến trong phân tích thống kê phần 1

Những sai lầm phổ biến trong phân tích thống kê phần 3

Chuyện “lạ”: Thái Nguyên chi tiền mua hàng trực tuyến nhiều hơn cả Hà Nội và TP.HCM

Hôm nay mình xem một bài báo trên ICTnews với cái title rất hấp dẫn người xem về xu hướng mua hàng online của thị trường Thương mại điện tử (TMĐT) hiện nay của Việt Nam – Chuyện “lạ”: Thái Nguyên chi tiền mua hàng trực tuyến nhiều hơn cả Hà Nội và TP.HCM. Nội dung của bài báo cơ bản ý nói các tỉnh miền núi phía bắc như Thái Nguyên (TN), Lào Cai, Lai Châu có lượng người tiêu dùng bỏ ra chi phí trung bình mua hàng qua mạng cao hơn các thành phố lớn như Hà Nội (HN), Hồ Chí Minh (HCM), hơn nữa bài báo cho biết lượng đơn hàng của Sendo.vn phát sinh đi các tỉnh (ngoài Hà Nội và Hồ Chí Minh) trong tháng 02/2014 chiếm đến 54% tổng giao dịch. Theo bài báo đã thống kê số liệu đơn hàng tháng 02/2014 của sàn TMĐT Sendo.vn thì tỉnh Thái Nguyên có giá trị đơn hàng trung bình là 472,522 đồng, Lào Cai 404,015 đồng, trong khi hai thành phố lớn Hà Nội và Hồ Chí Minh chỉ có lần lượt là 313,202 đồng và 256,822 đồng.

Thật nguy hiểm cho những ai đang tham gia hoạt động TMĐT đặt biệt những chủ Shop thời trang đang kinh doanh trên Sendo.vn khi dựa vào những thông tin phần trăm lượng đặt hàng ở tỉnh cao hơn và giá trị trung bình đơn hàng ở Thái Nguyên, Lào Cai cao hơn HN và HCM như trong bài báo mà có ý định đánh vào thị trường các tỉnh lẻ đặt biệt các tỉnh phía bắc được nêu lên trong bài báo. Để dể hình dung được những con số mà bài báo nêu ra để giải thích cho cái title là Thái Nguyên chi tiền mua hàng trực tuyến nhiều hơn cả HN và HCM, mời xem ví dụ sau:

Dữ liệu Sendo.vn cung cấp là một mẫu trong thị trường TMĐT hiện nay của Việt Nam thể hiện qua ví dụ nhỏ như bên dưới

Lượt đặt hàng Thái nguyên Hồ Chí Minh
1 300 200
2 100 150
3 300 190
4 70 140
5 90
Tổng 860 680
Trung bình 172 170
Trung vị 100 170
Phương sai 13.770 867
Độ lệch chuẩn 117 29
Khoản tin cậy 95%
Max 402 228
Min -58 112

Từ bảng trên ta thấy lượt đặt hàng ở TN cao hơn ở HCM một đơn hàng và giá trị trung bình đơn hàng ở TN cũng cao hơn ở HCM 2$ (172 – 170), nếu chỉ 2 thông số này kết luận rằng thị trường ở Thái Nguyên hấp dẫn hơn ở HCM là một sai lầm. Ta để ý giá trị trung vị của 2 thị trường cho thấy thị trường HCM (170) cao gần gấp đôi thị trường TN (100), nghĩa là hơn 50% đơn hàng ở TN có giá trị thấp hơn hoặc bằng 100$ thấp hơn rất nhiều so với giá trị trung bình đơn hàng ở TN là 172$ như vậy đa phần tập đơn hàng ở TN dưới mức 172$ con số này của HCM vẫn là 170$.

Tu phan vi Sai Gon

Biểu đồ tứ phân vị thị trường HCM
Tu phan vi Thai Nguyen

Biểu đồ tứ phân vị thị trường TN

Ngoài ra độ lệch chuẩn ở thị trường TN khá lơn cao hơn cả giá trị trung vị và gần bằng giá trị trung bình, đến đây dễ thấy thị trường TN biến thiên cao hơn thị trường HCM.

Giá trị trung bình đơn hàng của thị trường TN là 172 với độ lệch chuẩn là 117 thì khoản tin cậy 95% sẽ là 172 + 1.96*117 = 402; 172 – 1.96*117 = -58 điều này có nghĩa là nếu ta chọn một cách ngẫu nhiên một đơn hàng từ thị trường TN thì xác suất 95% đơn hàng có giá trị từ -58$ đến 402$. Thật ngạc nhiên khi ở đây khoản tin cậy có giá trị âm vì giá trị đơn  hàng không thể có giá trị âm, trường hợp này ta có thể hiểu là (1) hoặc phân phối của biến không tuân theo phân phối chuẩn, và các giá trị trung bình, độ lệch chuẩn, phương sai không còn ý nghĩa thực tế, (2) hoặc cách chọn mẫu có vấn đề.

Qua ví dụ trên với thông tin tỉ lệ đơn hàng ở tỉnh chiếm 54% và giá trị trung bình đơn hàng các tỉnh như vậy thì chưa đủ thông tin cho thấy các Shop nên đầu tư và các thị trường tỉnh lẻ như vậy rất mạo hiểm

Ngô Thông

Theo ICTnews

ICTnews – Những thống kê mà trang thương mại điện tử Sendo.vn đưa ra gây bất ngờ, khi người dùng các tỉnh như Thái Nguyên, Lai Châu và Lào Cai lại chi tiền trung bình cho một đơn hàng nhiều hơn cả Hà Nội và TP.HCM

Cụ thể, theo thống kê kinh doanh tháng 2/2014 về xu hướng mua sắm của người tiêu dùng Việt Nam được Sendo.vn thực hiện, kết quả cho thấy: 54% lượng đơn hàng của Sendo.vn phát sinh trên toàn lãnh thổ Việt Nam từ ngoài Tp Hồ Chí Minh và Hà Nội.  Trong đó 3 khu vực dẫn đầu có lượng người tiêu dùng bỏ ra chi phí cho 1 đơn hàng, hoàn toàn nằm trong khu vực các tỉnh miền núi phía bắc, đó là các tỉnh: Thái Nguyên, Lào Cai và Lai Châu. Theo đó, trong khi Thái Nguyên có giá trị đơn hàng trung bình là 472,522 đồng, Lào Cai 404,015 đồng, thì Hà Nội chỉ có 313,202 đồng và TP.HCM chỉ có 256,822 đồng.

Số liệu được đưa ra từ Sendo.vn trong tháng 2/2014

Về Sendo.vn thì đây là sàn thương mại điện tử chính thức của tập đoàn FPT, trong tháng 2/2014, theo Alexa, website này nằm trong top 3 website thương mại điện tử Việt Nam được truy cập nhiều nhất (sau vatgia.com và Lazada.vn).

Có một điểm đáng thú vị là cũng theo alexa, số thời gian người dùng bỏ ra truy cập vào trang này lại đang đứng số 1 tại Việt Nam, khi người dùng online trên trang tới 9 phút 45 giây, trong khi đó 123mua là 5 phút 54 giây và Lazada là 5 phút 41 giây.

Lê Mỹ