Sinh viên nghiên cứu ứng dụng mạng tích chập nơ ron trích xuất thông tin từ dữ liệu y văn

Đề tài khoa học của sinh viên Nguyễn Đức Thắng giúp các nhà nghiên cứu dễ dàng truy xuất nhanh thông tin liên quan đến bệnh và thuốc từ nguồn dữ liệu y văn khổng lồ…

{keywords}
Sinh viên nghiên cứu ứng dụng mạng tích chập nơ ron trích xuất thông tin từ dữ liệu y văn

Nguyễn Đức Thắng sinh viên năm thứ 3 khoa Công nghệ thông tin, Trường Đại học Công nghệ vẫn miệt mài thực hiện đề tài “Nâng cao chất lượng liên kết thực thể sinh học bằng cách xếp hạng lại dựa trên mạng nơ-ron tích chập”.

Đề tài dưới sự hướng dẫn của TS. Đặng Thanh Hải với những kết quả đạt được, đề tài đã đạt giải Ba sinh viên nghiên cứu khoa học trường Đại học Quốc gia Hà Nội (ĐHQGHN).

Đam mê thuật toán từ khi còn ngồi ghế trường THPT 

Từng đạt giải nhất môn Tin học cấp quốc gia khi còn là học sinh THPT, Nguyễn Đức Thắng luôn có sẵn niềm đam mê tìm hiểu, khám phá và nghiên cứu các thuật toán.

 “Cho đến khi vào học tại Trường Đại học Công nghệ (ĐHQGHN), thuật toán không chỉ là niềm đam mê của bản thân mà em còn mong muốn áp dụng những thuật toán đó vào cuộc sống. Ngay từ lúc đó, em đã quyết định tham gia vào phòng thí nghiệm mục tiêu Tin sinh y học do TS. Đặng Thanh Hải phụ trách.

Việc kết hợp Tin học vào lĩnh vực Y Sinh là xu hướng mới và thú vị nên Thắng muốn tìm hiểu thêm về lĩnh vực này. Và đề tài “Enhancing biomedical entity linking with re-ranking based on convolution neural networks” (“Nâng cao chất lượng liên kết thực thể sinh học bằng cách xếp hạng lại dựa trên mạng nơ-ron tích chập”) là cơ hội để Thắng thỏa niềm đam mê.

Dưới sự hướng dẫn của TS. Đặng Thanh Hải, sinh viên Nguyễn Đức Thắng đã giải quyết được một trong những bài toán thực tế, quan trọng trong việc trích xuất thông tin từ dữ liệu y văn.

Đức Thắng cho biết, hiện nay trong lĩnh vực khai phá dữ liệu y văn, có nhiều nhóm nghiên cứu trên thế quan tâm đến bài toán liên kết tên thực thể trong dữ liệu y văn, ví dụ như mô hình DNORM vào năm 2013; TaggerOne vào năm 2016 của Leaman và các cộng sự từ Trung tâm Công nghệ Tin Sinh học Hoa Kỳ; mô hình NormCo của Wright và các cộng sự vào năm 2019 từ Trung tâm Nghiên cứu trí tuệ nhân tạo của IBM và Đại học California San Diego…

Dựa trên việc nghiên cứu những mô hình này, đề tài khoa học của em đã đề xuất phương pháp truy xuất nhanh thông tin liên quan đến bệnh và thuốc từ nguồn dữ liệu y văn khổng lồ (PubMed là một ví dụ, hiện có gần 28 triệu bài báo khoa học, cứ 1 phút có 2 bài báo mới được thêm vào). Từ đó sẽ góp phần giảm thiểu chi phí và thời gian cho các nhà nghiên cứu liên quan.

Là người trực tiếp hướng dẫn Nguyễn Đức Thắng, TS. Đặng Thanh Hải chia sẻ, đề tài có khả năng ứng dụng ngay trong hệ thống trích xuất thông tin từ dữ liệu y văn bằng tiếng Anh và đối với hệ thống tiếng Việt trong tương lai. Dựa trên những ý nghĩa khoa học và tính thực tiễn của đề tài, Đức Thắng đã hoàn thiện bản thảo bài báo để gửi đăng tạp chí quốc tế uy tín.

Tính chính xác cao hơn so với một số mô hình trên thế giới

Đề tài tập trung vào giai đoạn “liên kết thực thể sinh học” trong bài toán trích xuất thông tin từ dữ liệu y văn. “Liên kết thực thể sinh học” là việc chuẩn hóa thực thể y sinh trong văn bản tới bộ định danh chuẩn của chúng được định sẵn trong cơ sở tri thức.

Theo đó, đề tài Đức Thắng nghiên cứu sẽ góp phần nâng cao độ chính xác của kết quả trong bước này. Hiện nay, trên thế giới cũng có nhiều nhóm đang nghiên cứu cùng với chủ đề của chàng sinh viên năm 3 này. Tuy nhiên đề tài của Đức Thắng đang có độ chính xác cao hơn so với một số mô hình sử dụng trên thế giới trong cùng một điều kiện so sánh.

Được biết, trong thời gian tới, Đức Thắng sẽ tiếp tục nghiên cứu để có thể cho ra một kết quả về độ chính xác tốt hơn nữa. “Và trong tương lai em sẽ tiếp tục nghiên cứu về pha khác như pha Nhận diện tên thực thể (Name-entity regconition), Trích xuất quan hệ (Relationship extraction) trong bài toán trích xuất thông tin y sinh từ các văn bản sinh học, để nâng cao hiệu quả trong lĩnh vực này” – Đức Thắng chia sẻ.

H. Anh 

Lần đầu tiên ra mắt ứng dụng kết nối dịch vụ công chứng trực tuyến tại Việt Nam

Chỉ với một vài thao thác đơn giản, chúng ta đã có thể kết nối với các tổ chức hành nghề công chứng mà không phải mất quá nhiều thời gian như trước kia.

Công nghệ xử lý nước thải góp phần giải quyết thực trạng ô nhiễm nguồn nước

Nhằm góp phần giải quyết thực trạng ô nhiễm nguồn nước đang ngày một nghiêm trọng tại Việt Nam, nhiều công nghệ xử lý nước thải tiên tiến hiện đã và đang được áp dụng ở nhiều địa phương từ các đơn vị nhận chuyển giao.

Nghiên cứu sản xuất sản phẩm thực phẩm hỗ trợ cải thiện trí nhớ

Sản phẩm từ đề tài được nghiên cứu sản xuất ở trong nước, công nghệ tiên tiến, phù hợp với trình độ khoa học hiện nay nên khả năng chuyển giao và sản xuất thuận lợi; tạo ra sản phẩm cạnh tranh...

Nhà ở xây chỉ hết 50 triệu đồng, thi công 5 ngày, tính ứng dụng cao

Ngôi nhà với tiêu chí phù hợp cho một hộ gia đình từ 3-4 người với kinh phí xây dựng tối đa chỉ 50 triệu đồng và thời gian thi công là 5 ngày nhưng vẫn đảm bảo các nhu cầu thiết yếu.

3 sáng kiến nổi bật của EVN trong năm 2020

Trong năm 2020 vừa qua ngành điện lực có nhiều sáng kiến ứng dụng KH&CN góp phần nâng cao hiệu quả quản lý hệ thống và chăm sóc khách hàng.

Nhà khoa học Việt sáng chế gieo sạ lúa kết hợp bón phân theo hàng

Nhóm nghiên cứu của Học viện Nông nghiệp Việt Nam do Tiến sĩ Nguyễn Thanh Hải dẫn đầu đã bắt tay vào nghiên cứu thiết kế, chế tạo máy gieo sạ lúa kết hợp bón phân theo hàng với sự trợ giúp của khí nén.

Chip vi lưu xét nghiệm máu phát hiện sớm ung thư phổi

Chip vi lưu không chỉ hứa hẹn trong phát hiện sớm tế bào ung thư biểu mô phổi ở người mà còn có tiềm năng phát hiện nhiều loại bệnh tế bào khác. 

Giám đốc ngồi xe lăn và sáng kiến đầu kéo xe lăn dành cho người khuyết tật

Không may gặp tai nạn giao thông vào năm 29 tuổi, anh Lê Huy Tích đã bị liệt cả hai chân. Việc phải di chuyển bằng xe lăn khiến anh tìm tòi và nảy ra sáng kiến về chiếc đầu kéo dành cho xe lăn.

“Hô biến” tro xỉ của Nhiệt điện Na Dương thành đường giao thông

Xuất phát từ nhu cầu thực tiễn, hai kỹ sư của Sở GTVT tỉnh Lạng Sơn đã nghiên cứu thành công đề tài “Nghiên cứu sử dụng tro xỉ của Nhà máy Nhiệt điện Na Dương làm mặt đường giao thông nông thôn”.

Sinh viên chế tạo công nghệ tạo vi giọt ứng dụng phân phối thuốc

Hệ thống vi lưu cấu trúc chữ Y tích hợp cảm biến có khả năng tạo vi giọt với kích thước giọt có thể điều khiển theo mong muốn.

Đang cập nhật dữ liệu !