Saturday, August 11, 2012

Giải quyết Homophily

Tôi mới tìm thấy và đọc qua một số nghiên cứu của Greg Ver Steeg, nghiên cứu viên ở Information Science Institute, University of South California (Đại học Nam California). Lý do là vì Ver Steeg quan tâm và đưa ra một số hướng giải quyết vấn đề tách homophily và influence trên các mạng xã hội (social networks). Đây là một câu hỏi thực nghiệm rất khó: Khi ta quan sát được một hành động/thuộc tính có liên hệ chặt chẽ giữa các  "đỉnh" (nôm na là các cá nhân) của một mạng quan hệ xã hội, liệu điều này phản ánh sự ảnh hưởng lẫn nhau trên mạng xã hội (theo cách giải thích này thì mạng xã hội đóng vai trò chính), hay chỉ thể hiện việc các đỉnh (cá nhân) này có những tính chất (ẩn hoặc quan sát được) giống nhau, và những tính chất này cùng thể hiện ra hành động/thuộc tính ta quan sát được (theo cách giải thích này thì mạng xã hội không đóng vai trò gì). Nhìn chung, để giải quyết được vấn đề thống kê này, chỉ có cách tạo kết nối trên mạng xã hội một cách ngẫu nhiên (randomize). (Hoặc có "biến công cụ" - instrumental variable - có sự ngẫu nhiên như vậy.) Điều này rất khó trong thực tế. Nếu Ver Steeg đưa ra lời giải tốt, thì có thể có những ứng dụng đặc biệt quan trọng trong kinh tế và xã hội học.

Tuy vậy, đọc qua thì tôi không cảm thấy thỏa mãn lắm. Đúng là khó có cách giải quyết tốt về mặt lý thuyết được. Ver Steeg có một nghiên cứu đề xuất một cách thử homophily, tuy vậy tôi nghĩ cách này tương đối yếu, và vẫn dựa vào giả thuyết thêm là yếu tố homophily không thay đổi theo thời gian. Còn lại, các nghiên cứu khác vẫn dựa vào mô hình cụ thể, vì thế khó có thể giải quyết vấn đề tổng quát.

Tôi viết ngắn gọn một chút để sau sẽ xem thêm các nghiên cứu về mạng xã hội trong ngành khoa học máy tính. Có lẽ có rất nhiều kết quả thú vị.