داده شناسی نجومی - ویکی‌پدیا، دانشنامهٔ آزاد

ابرخوشه اولیه Hyperion با اندازه گیری و بررسی داده های آرشیو رونمایی شد[۱]

داده‌شناسی نجومی یک رشته مطالعاتی بین رشته‌ای است که شامل ترکیبی از نجوم، علم داده، یادگیری ماشین، انفورماتیک و فناوری‌های اطلاعات/ارتباطات [۲] است. این رشته ارتباط نزدیکی با آمار نجومی دارد.

زمینه[ویرایش]

داده‌شناسی نجومی عمدتاً بر توسعه ابزارها، روش‌ها و کاربردهای علوم محاسباتی، علم داده، یادگیری ماشین و آمار برای تحقیق و آموزش در نجوم داده‌گرا متمرکز است.[۳] تلاش‌های اولیه در این جهت شامل کشف داده‌ها، توسعه استانداردهای ابرداده، مدل‌سازی داده‌ها، توسعه فرهنگ لغات داده‌های نجومی، دسترسی به داده‌ها، بازیابی اطلاعات[۴]، یکپارچه‌سازی داده‌ها، و داده‌کاوی[۵] در ابتکارات رصدخانه مجازی نجومی بود.[۶][۷] برای توسعه بیشتر این رشته و شناخته شدن آن و موقعیت‌هایش در سال 2009، همراه با تایید جامعه نجوم، مقاله ای به شورای تحقیقات ملی (ایالات متحده آمریکا) ارائه شد.[۸] آن مقاله موقعیت مبنایی را برای توضیح دقیق‌تر ابعاد و بخش‌های این رشته در مقاله مجله انفورماتیک Astroinformatics: Data-Oriented Astronomy Research and Education ارائه کرد. در سال 2012 نیز دو مقاله [۹][۱۰] به شورای انجمن نجوم آمریکا ارائه شد که منجر به ایجاد گروه‌های کاری رسمی در داده‌شناسی نجومی و اخترآمار برای حرفه نجوم در ایالات متحده و جاهای دیگر شد.[۱۱]

داده‌شناسی نجومی به عنوان یک زمینه تحقیقاتی متمایز از کار در زمینه‌های بیوانفورماتیک و ژئوانفورماتیک و توسط فعالیت های جیم گری (دانشمند کامپیوتر) در زمینه eScience[۱۲] در تحقیقات مایکروسافت الهام گرفته شد، که میراث آن از طریق جوایز eScience جیم گری ادامه یافت.[۱۳]


اگرچه تمرکز اصلی داده‌شناسی نجومی بر مجموعه گسترده توزیع شده در سراسر جهان از پایگاه‌های اطلاعاتی نجومی دیجیتال، آرشیو تصاویر و ابزارهای تحقیقاتی است، اما این رشته اهمیت مجموعه داده‌های قدیمی را نیز به رسمیت می‌شناسد که با استفاده از فناوری‌های مدرن برای حفظ و تحلیل مشاهدات نجومی تاریخی از انها بهره می‌برد. برخی از کارشناسان این حوزه به دیجیتالی کردن مشاهدات و تصاویر نجومی بدست آمده زمان حال یا گذشته در یک پایگاه داده بزرگ از طریق واسط های مبتنی بر اینترنت کمک می کنند.[۱۴] هدف دیگر کمک به توسعه روش‌ها و نرم‌افزارهای جدید برای اخترشناسان و همچنین کمک به تسهیل فرآیند و تجزیه و تحلیل حجم رو به رشد سریع داده‌ها در زمینه نجوم است.[۱۵]

داده‌شناسی نجومی به عنوان "پارادایم چهارم" تحقیقات نجومی توصیف می شود.[۱۶] حوزه‌های تحقیقاتی بسیاری درگیر داده‌شناسی نجومی هستند، مانند داده‌کاوی، یادگیری ماشین، آمار، تجسم، مدیریت داده‌های علمی، و علم معنایی.[۱۷] داده کاوی و یادگیری ماشین به دلیل تمرکز بر "کشف دانش از داده ها" و "یادگیری از داده ها" نقش مهمی در اختر انفورماتیک به عنوان یک رشته تحقیقاتی علمی ایفا می کنند.[۱۸][۱۹]

مقدار داده‌های جمع‌آوری‌شده از بررسی‌های آسمان نجومی در طول دهه گذشته از گیگابایت به ترابایت افزایش یافته است و پیش‌بینی می‌شود که در دهه آینده به صدها پتابایت با تلسکوپ بزرگ سینوپتیک و به اگزابایت با آرایه کیلومتر مربعی افزایش یابد.[۲۰] ] این انبوهی از داده‌های جدید، تحقیقات مؤثر نجومی را قادر می‌سازد و به چالش می‌کشد. بنابراین، رویکردهای جدید مورد نیاز است و تا حدی می‌توان گفت به این دلیل، علم داده محور در حال تبدیل شدن به یک رشته دانشگاهی شناخته شده است. در نتیجه، نجوم و سایر رشته‌های علمی در حال توسعه زیرشاخه‌های مبتنی بر اطلاعات و داده‌های فشرده هستند تا جایی که این زیرشاخه‌ها اکنون به رشته‌های تحقیقاتی مستقل و برنامه‌های دانشگاهی کامل تبدیل شده‌اند (یا قبلاً تبدیل شده‌اند). در حالی که بسیاری از مؤسسات آموزشی از برنامه‌های تحقیقاتی در زمینه داده‌شناسی نجومی برخوردار نیستند، چنین برنامه‌هایی به احتمال زیاد در آینده نزدیک توسعه خواهند یافت.

انفورماتیک اخیراً به عنوان "استفاده از داده های دیجیتال، اطلاعات و خدمات مرتبط برای تحقیق و تولید دانش" تعریف شده است. با این حال تعریف معمول این حوزه بدین صورت می‌باشد: "انفورماتیک رشته سازماندهی، دسترسی، یکپارچه سازی و استخراج داده ها از منابع متعدد برای کشف و پشتیبانی تصمیم گیری است." بنابراین، رشته داده‌شناسی نجومی شامل بسیاری از تخصص‌های مرتبط با طبیعت از جمله مدل‌سازی داده، سازماندهی داده‌ها و غیره است. همچنین ممکن است شامل روش‌های تبدیل و عادی‌سازی برای یکپارچه‌سازی داده‌ها و تجسم اطلاعات، و همچنین استخراج اطلاعات، تکنیک‌های نمایه‌سازی، بازیابی اطلاعات و داده‌کاوی باشد. پروژه‌های علمی شهروندی (مانند باغ وحش کهکشان) همچنین به کشف نوآوری‌های بسیار ارزشمند، برچسب‌گذاری ویژگی‌ها و خصوصیات اشیاء در مجموعه داده‌های بزرگ نجومی کمک می‌کنند. همه این تخصص‌ها در کنار مجموعه‌های مختلف داده‌های عظیم، تحقیقات مشترک و استفاده مجدد از داده‌ها، امکان اکتشافات علمی در محیط‌های پژوهشی و یادگیری را فراهم می‌کنند.

داده‌شناسی نجومی یک زمینه طبیعی برای ادغام آموزش و پژوهش فراهم می کند.[۲۱] اکنون می‌توان از تجربیات بدست آمده در تحقیقات انجام شده برای ایجاد و رشد علم داده استفاده کرد.[۲۲] همچنین این حوزه کاربردهای بسیار دیگری مانند استفاده مجدد از داده‌های آرشیوی برای پروژه‌های جدید، پیوندهای ادبیات-داده، بازیابی هوشمند اطلاعات، و بسیاری موارد دیگر دارد.[۲۳]

منابع[ویرایش]

  1. "Largest Galaxy Proto-Supercluster Found - Astronomers using ESO's Very Large Telescope uncover a cosmic titan lurking in the early Universe". www.eso.org. Retrieved 18 October 2018.
  2. Astroinformatics and digitization of astronomical heritage بایگانی‌شده در ۲۰۱۷-۱۲-۲۶ توسط Wayback Machine, Nikolay Kirov. The fifth SEEDI International Conference Digitization of cultural and scientific heritage, May 19–20, 2010, Sarajevo. Retrieved 1 November 2012.
  3. Borne, Kirk D. (12 May 2010). "Astroinformatics: data-oriented astronomy research and education". Earth Science Informatics. 3 (1–2): 5–17. doi:10.1007/s12145-010-0055-2. S2CID 207393013.
  4. Borne, Kirk (2000). "Science User Scenarios for a Virtual Observatory Design Reference Mission: Science Requirements for Data Mining". arXiv:astro-ph/0008307.
  5. Borne, Kirk (2008). "Scientific Data Mining in Astronomy". In Kargupta, Hillol; et al. (eds.). Next generation of data mining. London: CRC Press. pp. 91–114. ISBN 9781420085860.
  6. Borne, Kirk D (2003). "Distributed data mining in the National Virtual Observatory". In Dasarathy, Belur V (ed.). Data Mining and Knowledge Discovery: Theory, Tools, and Technology V. Data Mining and Knowledge Discovery: Theory, Tools, and Technology V. Vol. 5098. pp. 211–218. doi:10.1117/12.487536. S2CID 28195520.
  7. Laurino, O.; D’Abrusco, R.; Longo, G.; Riccio, G. (21 December 2011). "Astroinformatics of galaxies and quasars: a new general method for photometric redshifts estimation". Monthly Notices of the Royal Astronomical Society. 418 (4): 2165–2195. arXiv:1107.3160. Bibcode:2011MNRAS.418.2165L. doi:10.1111/j.1365-2966.2011.19416.x. S2CID 7115554.
  8. Borne, Kirk (2009). "Astroinformatics: A 21st Century Approach to Astronomy". Astro2010: The Astronomy and Astrophysics Decadal Survey. 2010: P6. arXiv:0909.3892. Bibcode:2009astro2010P...6B.
  9. Borne, Kirk. "Astroinformatics in a Nutshell". asaip.psu.edu. The Astrostatistics and Astroinformatics Portal, Penn State University. Retrieved 11 January 2016.
  10. Feigelson, Eric. "Astrostatistics in a Nutshell". asaip.psu.edu. The Astrostatistics and Astroinformatics Portal, Penn State University. Retrieved 11 January 2016.
  11. Feigelson, E.; Ivezić, Ž.; Hilbe, J.; Borne, K. (2013). "New Organizations to Support Astroinformatics and Astrostatistics". Astronomical Data Analysis Software and Systems Xxii. 475: 15. arXiv:1301.3069. Bibcode:2013ASPC..475...15F.
  12. "Online Science". Talks by Jim Gray. Microsoft Research. Retrieved 11 January 2015.
  13. "Jim Gray eScience Award". Microsoft Research.
  14. Astroinformatics in Canada, Nicholas M. Ball, David Schade. Retrieved 1 November 2012.
  15. "'Astroinformatics' helps Astronomers explore the sky". Phys.org. Heidelberg University. Retrieved 11 January 2015.
  16. Hey, Tony (October 2009). "The Fourth Paradigm: Data-Intensive Scientific Discovery". Microsoft Research.
  17. Borne, Kirk (2013). "Virtual Observatories, Data Mining, and Astroinformatics". Planets, Stars and Stellar Systems. pp. 403–443. doi:10.1007/978-94-007-5618-2_9. ISBN 978-94-007-5617-5.
  18. Ball, N.M.; Brunner, R.J. (2010). "Data Mining and Machine Learning in Astronomy". International Journal of Modern Physics D. 19 (7): 1049–1106. arXiv:0906.2173. Bibcode:2010IJMPD..19.1049B. doi:10.1142/S0218271810017160. S2CID 119277652.
  19. Borne, K; Becla, J; Davidson, I; Szalay, A; Tyson, J. A; Bailer-Jones, Coryn A.L (2008). "The LSST Data Mining Research Agenda". AIP Conference Proceedings. pp. 347–351. arXiv:0811.0167. doi:10.1063/1.3059074. S2CID 118399971.
  20. Ivezić, Ž; Axelrod, T; Becker, A. C; Becla, J; Borne, K; Burke, D. L; Claver, C. F; Cook, K. H; Connolly, A; Gilmore, D. K; Jones, R. L; Jurić, M; Kahn, S. M; Lim, K.-T; Lupton, R. H; Monet, D. G; Pinto, P. A; Sesar, B; Stubbs, C. W; Tyson, J. A; Bailer-Jones, Coryn A.L (2008). "Parametrization and Classification of 20 Billion LSST Objects: Lessons from SDSS". AIP Conference Proceedings. AIP Conf. Proc. Vol. 1082. pp. 359–365. arXiv:0810.5155. doi:10.1063/1.3059076. S2CID 117914490.
  21. Borne, Kirk (2009). "The Revolution in Astronomy Education: Data Science for the Masses". Astro2010: The Astronomy and Astrophysics Decadal Survey. 2010: P7. arXiv:0909.3895. Bibcode:2009astro2010P...7B.
  22. "Using Data in the Classroom". Science Education Resource Center at Carleton College. National Science Digital Library. Retrieved 11 January 2016.
  23. Borne, Kirk. Astroinformatics: Data-Oriented Astronomy (PDF). George Mason University, USA. Retrieved January 21, 2015.