ВВЕДЕНИЕ
При создании новых ресурсов в сети Интернет следует задуматься о том, какая аудитория его будет посещать, и откуда будут приходить пользователи. Создание веб-сайта без дальнейшей его поддержки и продвижения может осложнить его индексацию и интерпретацию поисковыми роботами, в следствии чего, сайт может долго развиваться и так и не достигнуть своих целей. Для того, чтобы веб-сайт посещала его целевая аудитория необходимо постоянно поддерживать его контент и техническое состояние в надлежащем состоянии, а также оптимизировать веб-сайт для индексации поисковыми системами.
На сегодняшний день для анализа технического состояния веб-сайтов и определения степени их оптимизации существуют всевозможные информационные системы и средства автоматизации. Однако прогресс в области информационных технологий не стоит на месте в связи с чем на предприятии необходима постоянная модернизация как информационных технологий, так и систем.
Целью выпускной квалификационной работы является разработка информационной системы, позволяющей проводить оперативный технический и SEO аудит веб-сайтов, минимизировать время тестирования новых версий приложений и определять возможные проблем при индексации новой версии приложения поисковыми системами.
Для реализации данного проекта необходимо решить следующие задачи:
провести анализ предметной области и осуществить проектирование информационной системы технического и SEO аудита веб-приложений;
выбрать инструменты для возможности реализации информационной системы, с учетом текущих технических возможностей;
разработать и внедрить систему технического и SEO аудита веб-приложений;
провести оценку экономической эффективности разрабатываемой системы.
Система технического и SEO аудита веб-приложений предназначена для анализа технических и внутренних SEO факторов веб-приложения. Данный анализ позволяет сократить время тестирования веб-приложений и найти факторы, которые могут понизить ранжирование сайта в поисковых системах.
Необходимость разработки системы технического и SEO аудита веб-приложений ООО «Максимал» связана с отсутствием на рынке систем, которые удовлетворяют всем целям компании.
Главным основанием для разработки программного продукта был заказ на создание системы, позволяющей проводить оперативный аудит всех внутренних критериев, влияющих на ранжирование веб-сайтов в выдаче поисковых систем.
На данный момент в компании не используют программное обеспечение или веб-сервисы для проведения технического и SEO аудита, так как нет универсальных систем, удовлетворяющих всем требованиям компании.
Объект исследования: процесс технического и SEO аудита веб-приложений.
Предмет исследования: автоматизация работы сотрудников отделов разработки и продвижения в области тестирования веб-приложений.
Результаты работы были апробированы на:
международной научно-практической конференции «Молодёжный форум: технические и математические науки» (г. Воронеж);
пятой всероссийской научно-практической конференции студентов, аспирантов и молодых ученых «Актуальные проблемы современной науки: взгляд молодых» (г. Челябинск).
ГЛАВА 1 АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ
1.1 Анализ состояния исследуемого вопроса в конкретной области науки или технологии
В современном мире каждую секунду пользователи сети Интернет просматривают в веб-браузере миллионы веб-страниц получая гигабайты информации.
Но попытавшись оценить информацию в сети Интернет на основании традиционных представлений, можно столкнуться с серьезными проблемами.
Информацию невозможно оценить по весу, в байтах. В зависимости от оформления две страницы с одинаковыми текстами и рисунками могут отличаться друг от друга по весу в несколько раз.
Информацию невозможно оценить по смыслу. Один и тот же текст, например, «Я помню чудное мгновенье ...» А. С. Пушкина, размещенный на двух страницах, имеет один и тот же смысл. Но ценность этих двух страниц может отличаться на порядки в зависимости от того, насколько часто посетители заходят на каждую из них.
Информацию очень трудно оценить по праву собственности. В Интернете много «бесхозных» данных и данных, права на которые оспариваются. Много полных и неполных дубликатов текстов и изображений. Широко распространено «заимствование», а то и откровенное воровство интересных статей, изображений, таблиц, аудио- и видеофайлов, идей.
Ценность информации как данных определить практически невозможно. Зато довольно несложно определить экономическую ценность любой веб-страницы. Проще говоря, ее стоимость. Каждую страницу можно оценить в привычной для бизнеса шкале измерений – в деньгах.
Стоимость веб-страницы напрямую зависит от двух показателей – посещаемости и характеристики аудитории [34].
По данным компании World Wide Web Technology Surveys, занимающийся исследованиями в области веб-технологий, по состоянию на конец первого квартала 2016 года всемирная сеть Интернет насчитывает около трехсот миллионов активных доменных имен. Среди которых второе место, после зоны «.com», по популярности доменных зон, занимает доменная зона «.ru» [22].
Однако люди не могут запомнить адреса всех веб-страниц, и связать их с данными расположенными на них. В связи с этим с ростом сети Интернет стали появляться навигационный сервисы, изначально это были простые каталоги страниц, затем они переросли в поисковые системы, которые позволяют искать информацию по огромному количеству веб-страниц.
Но для того, чтобы поисковые системы выводили сайт в начале поисковой выдачи необходимо чтобы сайт, был оптимизирован для поисковых систем.
Для дальнейшего рассмотрения исследуемого вопроса приведем несколько определений.
SEO (Search Engine Optimization, поисковая оптимизация) - комплекс мер по внутренней и внешней оптимизации страниц сайта, для поднятия позиций сайта в результатах выдачи поисковых систем по определенным запросам пользователей, с целью увеличения трафика (для информационных ресурсов) и потенциальных клиентов (для коммерческих ресурсов) и последующей монетизации этого трафика.
Оптимизация сайта – это основа продвижения. Если на сайте не будет грамотной оптимизации и хороших поведенческих факторов – никакие внешние усилия помогут продвинуть сайт в топ по конкурентным запросам. Причем важно сразу разделить две смежные области работы над сайтом: поисковая оптимизация сайта и работа над поведенческими факторами.
Поисковая оптимизация сайта. Ее еще называют внутренней оптимизацией или работой над внутренними факторами. При этом работы на сайте ведутся в отрыве от любых внешних факторов (обратных ссылок, поведения пользователей и т.д). Задача поисковой оптимизации заключается в том, чтобы подготовить, оформить и разместить контент сайта, начиная от метатегов и заканчивая текстами на страницах. При правильном подходе позиции сайта в поиске устремляются вверх. Но незначительные, на первый взгляд, ошибки могут привести к печальному результату, начиная с низких позиций и заканчивая санкциями поисковых систем.
Работа над поведенческими факторами. Целью работы над поведенческими факторами посетителей сайта является увеличение активности пользователей на сайте, рост конверсии (то есть превращение посетителей в клиентов), побуждение посетителей повторно возвращаться на сайт. Высокая активность пользователей на сайте – это позитивный сигнал для поисковых систем. Но если пользователи часто сразу покидают сайт при переходе из поиска, это плохой знак для поисковиков. Позиции таких сайтов в поиске будут понижаться, особенно по конкурентным запросам.
Информационная система (ИС) — система, предназначенная для хранения, поиска и обработки информации, и соответствующие организационные ресурсы (человеческие, технические, финансовые и т. д.), которые обеспечивают и распространяют информацию [1].
Аудит сайта – это детальный, полный анализ ресурса на его соответствие требованиям, предъявляемым поисковыми системами для осуществления поискового продвижения, а также оценка его привлекательности для пользователей.
Существует три вида аудита сайтов: базовый, технический и SEO аудит.
Базовый аудит сайта – аудит, направленный на определение текущего состояния поисковой оптимизации сайта. В процессе данного аудита производится определение таких показателей как: тематический индекс цитирования, pagerank, количество проиндексированных страниц в поисковиках, количество внешних ссылок с сайта и на сайт, наличие сайта в популярных каталогах, определение количества посетителей, просмотров, ядра аудитории и т.д.
Технический аудит сайта – аудит, действия которого направлены на выявление технических факторов, мешающих продвижению сайта, среди которых: валидность html-кода и css-стилей, валидность ссылок, валидность файлов robots.txt и sitemap.xml, быстрота загрузки страниц сайта, валидность настройки редиректов и страниц ошибок.
SEO аудит сайта – аудит, направленный на определение степени поисковой оптимизации сайта, в ходе данного аудита проверяются такие факторы как: качество контента (степень оптимизации, уникальность, объем и т.д.), семантическое ядро сайта, качество и количество внешних ссылок, ведущих на сайт, траст сайта и страниц, грамотность использования тегов noindex и nofollow, позиции сайта в поисковых системах.
Тематический индекс цитирования (тИЦ) — индекс определяющий «значимость» веб-сайтов в поисковой системе Яндекс с учетом качества ссылок на них с других веб-сайтов. Эта качественная характеристика называется «весом» ссылки. Она рассчитывается по специальному алгоритму, в котором наибольшую роль играет схожесть тематики веб-сайта с сайтами, на которых расположены ссылки на этот сайт.
PageRank, также, как и тИЦ, является показателем «значимости» веб-сайтов в поисковой системе Google, но в отличие от тИЦ данное значение рассчитывается не для всего веб-сайта, а для отдельных веб-страниц. Каждая ссылка на страницу с другого сайта увеличивает PageRank ресурса. Наибольший вес имеют ссылки, размещение которых связано с качеством содержания сайта.
Sitemap (карта сайта) — XML-файл, состоящий из списка URL-адресов данного веб-сайта и метаданных этих адресов. Данный файл помогает поисковым системам более качественно и быстро сканировать сайт. Среди метаданных привязанных к адресам веб-страниц могут быть:
приоритет ссылки;
частота изменений страницы;
дата последнего изменения.
Стандарт исключений для роботов (robots.txt) — файл ограничения доступа к содержимому роботам на http-сервере. Файл должен находиться в корне сайта (то есть иметь путь относительно имени сайта /robots.txt). Данный файл дополняет стандарт Sitemaps.
Семантическое ядро сайта — это база поисковых слов, их словосочетаний и морфологических форм, наиболее точно характеризующих вид деятельности, товары или услуги, которые предлагает сайт, и специально подобранных для его продвижения. Семантическое ядро используется специалистами по оптимизации для максимально грамотного и эффективного продвижения сайтов. Более того, в условиях современной конкуренции хоть сколько-нибудь результативное продвижение невозможно без составления и использования семантического ядра. И даже определение приблизительной стоимости процесса продвижения сайта происходит с помощью семантического ядра.
Ссылочная масса – общее число проиндексированных поисковыми системами открытых ссылок, которые перенаправляют пользователя на определенный сайт. Наибольший вес и, соответственно, пользу для целевой страницы приносят ссылки с ресурсов схожей тематики, окруженные уникальным и, что немаловажно, релевантным текстом. Большое значение имеет также общее число внешних ссылок на данной странице, тИЦ и PageRank донора (сайта, где размещена ссылка) и некоторые другие факторы.
|