Поплавок (11 Август 2013 - 22:50) писал:
Вот уже больше 2 лет у вас, но начинает бесить, то у вас статистика не пашет, то ещё что...
Проблема в том что мы - это не не весь интернет. Прежде чем Вы попадаете на любой сайт запрос проходит среди почти десятка посредников, проблемы возникают на разных этапах прохода вашего запроса, отчего падения технически не решаемый вопрос. Его можно решить лишь распределением и многократным дублированием данных, но это всегда приводит к не консистентным данным, (например могут появиться 2 одинаковые записи, либо данные могут быть потеряны), отчего решения идинственно возможные кластер на уровне датацентра - это максимум, который пока придумали. Исторически мы находимся в российском ДЦ, который падает. Переехать громадной махиной оттуда не так уж просто технически, поэтому этот процесс затягивается. Мы переписали систему, которая уже может выдавать страницы сайта при не работающих датацентрах!, как это происходит сейчас. Система не дописана и не оттестирована, отчего сейчас возникают 503 ошибки, мы сидим перезапускаем PHP сервер где-то раз в минуту. Пока это ещё не до конца решённая задача. Также вообще ещё не подходили к задаче создания очередей для заказов и обратной связи, чтобы в момент обрывов связи заказы оформлялись как обычно в штатном режиме. Обрывы связи есть по определению, технически система скоро начнёт работать стабильно. Датацентр Бункер, постоянно подкладывающий всем нам свинью очень сильно мотивирует как можно быстрее закончить работу в направлении стабильности работы всей системы в целом.
Статистика уже работает на новом оборудовании, в другом ДЦ, уже готов прототип. Для точной статистики лучше пока использовать дополнительные счётчики на сайте - яндекс.метрику и гугл аналитикс.
Пока работа идёт ошибки не избежны. Я лично считаю лучше видеть что ошибки появляются и их быстро исправляют, нежели видеть совершенно стабильный в плане функционала сайт, которого обходят не дремлющие конкуренты.
Поплавок (11 Август 2013 - 22:50) писал:
Сколько клиентов потеряно из за этого?
Понимаю что не мало, с другой стороны тут вопрос смены шило на мыло. Не падающих датацентров нет в природе, пока их не изобрели. Изобрели лишь множественное дублирование и кластеры внутри датацентров, не более. Когда вбивают сваю в кабели и отрубают ДЦ от мира Вам не помогут такие системы. А дублирование позволит лишь отображать сайт как прежде, но без возможности что-либо изменять на нём. Возможно Вы встречали такие сообщения вконтакте или на яндексе, в интерфейсх google adwords, они просто пишут что нельзя пока попасть вообще в раздел, он не доступен, зайдите позже.
Мы не миллиардная компания, но этот вопрос можем решить немного иначе за счёт иной структуры, витрина сайта будет доступна практически 100% времени, не доступна будет лишь админка сайта.
Если сравнивать с аналогичными сервисами, у них таких решений не встречал. Как-то из интереса запускал сервис проверки доступности сайта на более чем 15 похожих сервисов, как наших так и зарубежных, не раз видел падения, аптайм за квартал был не высок, это однозначно не кластерные и даже не междатацентровые решения.
Поплавок (11 Август 2013 - 22:50) писал:
Какие то компенсации, возмещения будут?
Не смотря на то что проблема возникла не по нашей вине, при прошлом падении мы произвели возврат целиком за день. Сегодня скорее всего возмещения не будет, в любом случае переговорю по этому поводу с руководством.
Konstantin199 (11 Август 2013 - 22:55) писал:
денежка капает,а сайтик не работает,ЗАШИБИСЬ!!!
Не работал он лишь частично, мы прикладывали все усилия, чтобы минимизировать потери.