تحلیل استنادی به بررسی فراوانی، الگوها و نمودارهای استنادها در اسناد مختلف میپردازد. این تحلیل از الگوی استناد استفاده کرده و یک سند را به سند دیگر پیوند میزند تا ویژگیهای اسناد را آشکار سازد.
هدف اساسی از تحلیل استنادی تعیین مهمترین اسناد در یک مجموعه است. نمونه کلاسیک آن استنادات میان کتابها و مقالات آکادمیک است. همچنین قضات در احکام صادر شده برای پشتیانی از آرای خود به احکام صادرشده در نمونههای پیشین ارجاع میدهند؛ بنابراین، تحلیل استنادی در متون حقوقی نیز بسیار حائز اهمیت است. یک نمونه دیگر از کاربردهای تحلیل استنادی مربوط به حق اختراعات دارای دانش پیشین است، یعنی استناد به حق اختراعات قبلی که به مورد فعلی ارتباط دارند.
اسناد علاوه بر استنادات میتوانند با ویژگیهای متعدد دیگری نظیر نویسندگان، ناشران، مجلات و متون آنها ارتباط داشته باشند. تحلیل عمومی مجموعهای از اسناد “کتابسنجی” نامیده میشود و تحلیل استنادی، بخش اصلی این حوزه است. برای مثال اشتراک در مأخذ و اشتراک در متن دو اقدام وابسته و مبتنی بر تحلیل استنادی هستند (استناد مشترک یا ارجاعات مشترک). استناد موجود در یک مجموعه اسناد را نیز میتوان همان طور که دِرِک جی. دِسولا پریسین در مقالهی “شبکههای مقالات علمی” (۱۹۶۵) اشاره میکند، در اشکالی نظیر گراف استناد نمایش داد. این بدان معناست که تحلیل استنادی بر جنبههایی از تحلیل شبکه اجتماعی و علم شبکه متکی است.
یک نمونهی اولیه از شاخصگذاری، استناد خودکار CiteSeer است که برای استنادات میان مقالات آکادمیک مورد استفاده قرار میگیرد. علاوه بر این گوگل اسکالر نمونهای از یک سیستم مدرن است که شامل چیزی بیش از کتابها و مقالات آکادمیک است که در آن طیف وسیعتری از منابع اطلاعاتی مورد ارجاع قرار میگیرند. امروزه شاخصگذاری استنادی خودکار ماهیت مطالعات تحلیل استنادی را تغییر داده و امکان تجزیه و تحلیل میلیونها استناد برای یافتن الگوهایی در مقیاسهای بزرگ و دانشپروژه را فراهم میسازد. برای سنجش معیارهای مختلف تأثیر محققان بر اساس دادههای حاصل از ایندکسهای استناد میتوان از ابزارهای تحلیل استنادی استفاده کرد. این ابزارها کاربردهای متنوعی دارند و میتوانند در موارد متعددی از تعیین داوران متخصص برای مرور مقالات و ارائهی پیشنهادات، تا ارائهی دادههای شفاف در حمایت از بررسی شایستگیهای آکادمیک، استخدام دائمی و تصمیمات مربوط به ارتقای شغلی مورد استفاده قرار گیرند. این رقابت بر سر منابع محدود ممکن است به بازخوردهای اخلاقی پرسشبرانگیزی در جهت افزایش استنادات منتهی گردد.
بخش قابل توجهی از انتقادات به استفاده از صرف تحلیلهای استنادی برای مقایسهی تأثیر مقالات پژوهشی مختلف، بدون در نظر گرفتن سایر عواملی که ممکن است الگوی استناد را تحت تأثیر قرار دهند، مربوط میشود. از میان این انتقادات، یک مورد بر “عوامل وابسته به زمینهی مطالعاتی” متمرکز است و به این حقیقت اشاره میکند که روشهای استناد در رشتههای مختلف علمی و حتی در حوزههای مختلف مطالعاتی در یک رشتهی علمی، متغیر است.
مرور کلی
در حالی که شاخصهای استناد در ابتدا برای بازیابی اطلاعات طراحی شده بودند، اما به شکل فزایندهای در کتابسنجی و سایر مطالعات شامل ارزیابی تحقیق به کار برده میشوند. دادههای استناد مبنای ضریب تأثیر مجله نیز هستند.
مطالعات موضوعی فراوانی درباره تحلیل استنادی که گاه “علمسنجی” (اصطلاحی که برای اولین بار توسط واسیلی نالیمو استفاده شد) یا به طور دقیقتر “کتابسنجی” خوانده میشود وجود دارد. این حوزه با ظهور شاخص استناد علمی شکوفا شد که متون منبع از سال ۱۹۰۰ تا کنون را پوشش میدهد. مجلات پیشرو در این حوزه ساینسمتریکز، اینفورمتریکز و مجله انجمن علوم اطلاعات و تکنولوژی آمریکا هستند. ASIST نیز سرویس فهرست پست الکترونیکی به نام SIGMETRICS را میزبانی میکند. این روش با انتشار گسترده پایگاههای دادهی اشتراکی وب ساینس و اسکاپوس در بسیاری از دانشگاهها و دسترسی به ابزارهای استناد رایگان نظیر CiteBase ،CiteSeerX، گوگل اسکالر و ویندوز لایو آکادمیک سابق (امروزه با ویژگیهای اضافی تحت عنوان مایکروسافت آکادمیک دردسترس است) در سرتاسر جهان متحول شده است.
روشهای مطالعه تحلیل استنادی شامل رویکردهای کیفی، کمّی و محاسباتی است. این نوع از مطالعات علمسنجی بر مواردی همچون مقایسه بهرهوری، رتبهبندی مطالعات سازمانی، رتبهبندی مجلات با تثبیت استانداردهای بهرهوری دانشگاه و استانداردهای شغلی، ارزیابی تأثیر مقالات پژوهشی برتر، پیگیری مسیر توسعه یک حوزهٔ علمی یا فنآوری، و توسعهی شاخصهای نویسندگان و سازمانهای برتر بر اساس عملکرد تحقیقاتی متمرکز هستند.
تاریخچه
درک جی. دِسولا پرایس در مقاله خود خصوصیات اتصال ذاتی در SCI را با عنوان “شبکههای مقالات علمی” توصیف کرد. اتصالات میان مقالات استناددهنده و استنادشده زمانی پویایی یافت که انتشار آنلاین SCI آغاز گردید. شاخص استناد علوم اجتماعی یکی از اولین پایگاههای داده بود که در سال ۱۹۷۲ در آن سیستم دیالوگ مورد استفاده قرار گرفت. با کمک فنآوری دیسکهای سیدی، ارتباطها بسیار آسانتر گردید و استفاده از اشتراک در مأخذ را برای یافتن سابقههای مربوطه امکانپذیر ساخت. در سال ۱۹۷۳، هنری اسمال اثر کلاسیک خود را درباره تحلیل اشتراک در متن منتشر ساخت که به یک سیستم طبقهبندی خودساماندهنده تبدیل شد و در نهایت به «اطلس علوم» که بعدها “بررسیهای پژوهشی” خوانده شد، انجامید.
ماهیت توپولوژیک و گرافیکی ذاتی شبکه جهانی استناد که ویژگی اصلی متون علمی است در سال ۱۹۶۵ توسط رالف گارنر (دانشگاه درکسل) توصیف گردید.
استفاده از شمارش استنادها برای رتبهبندی مجلات، تکنیکی است که در دهههای آغازین قرن نوزدهم استفاده میشد اما اندازهگیری مداوم سیستماتیک این شمارشها برای مجلات علمی توسط یوجین گارفیلد در مؤسسه اطلاعات علمی آغاز شد که پیشگام در استفاده از این شمارشها برای رتبهبندی نویسندگان و مقالات نیز بود. او و ایروینگ شر در مقالهی برجسته خود در سال ۱۹۶۵ ارتباط میان فراوانی استناد و ترفیع مقام را با اشاره به این نکته که تعداد مقالات منتشر شده برندگان جایزه نوبل پنج برابر متوسط تعداد مقالات بود و در عین حال ۳۰ تا ۵۰ برابر بیش از حد متوسط به مقالات آنها استناد شده است، نشان دادند. گارفیلد با انجام مجموعهای از بررسیهای طولانی روی نوبل و جوایز دیگر این پدیده را گزارش داد. معیار اختصاری معمول که با عنوان “ضریب تأثیر” شناخته میشود برابر با تعداد استنادات به یک مجله در طول دو سال گذشته تقسیم بر تعداد مقالات منتشر شده در همان دو سال است. این معیار هم برای اهداف مناسب و هم برای اهداف نامناسب کاربرد گستردهای دارد (از این رو استفاده از این معیار به تنهایی برای رتبهبندی نویسندگان و مقالات کاملاً بحثبرانگیز است).
گارفیلد و شر در سال ۱۹۶۴ در یک مطالعهی اولیه پیرامون استفاده از تحلیل استنادی در نوشتن تاریخچه دیانای اهمیت تولید گرافهای تاریخی و نقشههای توپولوژیکی به عنوان مهمترین بخشهای موجود در تاریخ موضوعات علمی به نمایش گذاشتند. این تحقیق بعدها توسط ای. گارفیلد، اِی، آی. پادوکین، مؤسسه زیستشناسی دریایی، آکادمی علوم روسیه و وی. اسو استومین از مرکز آموزش، یادگیری و فنآوری و دانشگاه ایالتی واشینگتون خودکار شد و در حدود سال 2002 به ایجاد نرمافزار HistCite منتهی گردید.
شاخصگذاری استناد خودکار در سال ۱۹۹۸ توسط لی گیل، استیو لاورنس و کورت بولاکر معرفی گردید و استخراج الگوریتمی خودکار و گروهبندی استنادات برای هر سند دیجیتال علمی و آکادمیک را امکانپذیر ساخت. در حالی که قبلاً استخراج استنادات فرآیندی دستی بود، هماکنون میتوان معیارهای استناد را مقیاسگذاری و برای هر سند و حوزه پژوهشی و علمی (نه فقط اسناد انتخاب شده توسط سازمانهایی نظیر ISI) محاسبه نمود. این تحولات به ایجاد سیستمهای جدید برای شاخصگذاری استناد عمومی و خودکار با عنوان اولیه CiteSeer منتهی شد (اکنون CiteSeerX خوانده میشود). بعدها سیستمهای بزرگمقیاس استناد حوزهی آکادمیک نظیر گوگل اسکالر و مایکروسافت آکادمیک تولید شدند. این نوع شاخصگذاری استناد خودکار در استخراج استناد یا خوشهبندی استناد با داشتن نرخ خطای تخمینی ۱۰٪ علیرغم نمونهگیری دقیق آماری کامل نیست. این مسئله باعث شد نویسندگانی نظیر آن آربور، میلتون کینز و والتون هال به خروجی آکادمیک وسیعی دست پیدا کنند. SCI مدعی ایجاد شاخصگذاری استنادی خودکار از طریق روشهای صرفاً برنامهریزی شده است. حتی سابقههای قدیمیتر در این مورد نیز میزان خطای مشابهی دارند.
تحلیل استنادی برای اسناد حقوقی
تحلیل استنادی در اسناد حقوقی راهکاری برای درک بهتر و تجزیه و تحلیل اسناد شکایات قانونی مرتبط به هم از طریق کشف استناداتی است که مواد قانونی را به مواد قانونی دیگر در همان سند یا اسناد مختلف مرتبط میسازد. تحلیل استنادی از یک گراف استنادی استخراج شده از یک سند قانونی استفاده میکند که میتواند مکمل کشف الکترونیک باشد (فرآیندی که از نوآوریهای فنآورانه در تحلیل دادههای بزرگ استفاده میکند).
نشر الکترونیک
به دلیل رشد بیسابقه در دسترسی به منابع الکترونیک (e-resource)، یکی از پرسشهایی که مطرح میشود این است که منابع الکترونیک در حوزه مطالعاتی من چند بار استناد شده است؟ برای مثال ادعاهایی وجود دارد مبنی بر این که دسترسی آنلاین به متون علمی کامپیوتری به نرخ استناد بالاتر منجر میشود؛ با این حال مقالات انسانشناسی، اگر چاپی نباشند، ممکن است از این موضوع متضرر شوند.
خوداستنادی
این انتقاد وارد شده است که نویسندگان با انباشت استنادات از طریق استناد گسترده به مقالات خود سیستم را به بازی میگیرند. برای مثال، مشخص شده است که مردان بیش از زنان به استناد به مقالات خود تمایل دارند.