По работе занимаюсь сбором всяких разных данных с доступных ресурсов. На данный момент у меня в руках находится база данных товаров одного российского ритэйлера по г. Санк-Петербургу. Название компании приводить не буду, дабы не делать рекламы. Скажу лишь что в базе находится примерно 110 000 наименований товаров от 3000 разных производителей. По этим товарам имеется следующая информация: категория, производитель, цена, количество отзывов и рейтинг товара. Решил немного обработать эти данные и посмотреть ширину ассортимента в зависимости от цены. Принцип следующий: список наименований товаров сортируется по цене и для каждой цены выбирается количество наименований, попадающих в диапазон плюс/минус 5% от текущей цены. Подобную выборку сделал для всего товарного ассортимента, затем по нескольким категориям (смартфоны, холодильники и стиральные машины) и по нескольким производителям (Bosh, Apple, Phillips, HP). Затем для каждой выборки построил график и посчитал математическое ожидание. Кому интересно, предлагаю взглянуть на результат.
1. Весь ассортимент товаров.
Сюда входит большое разнообразие всякой всячины, начиная от ПВХ изоленты за 10 рублей и заканчивая дорогущими телевизорами и проекторами. Для наглядности сделал 3 графика по данной выборке, чтобы лучше было видно область наибольшей ширины ассортимента.
Математическое ожидание для этой выборки составило 9214 рублей.
2. Анализ по категории.
Данный пункт для меня был, наверно, наиболее интересен. Хотелось в первую очередь взглянуть на графики (есть ли пики и на каких ценах), а также увидеть среднее значение цены (мат. ожидание).
Мат. ожидание: 16268 руб.
Мат. ожидание: 28988 руб.
Мат. ожидание: 28521 руб.
3. Анализ по производителю.
Производители выбраны не случайным образом, а по наибольшей ширине ассортимента, представленного у данного ритэйлера. Наибольшая ширина получилось у Bosch (более 900 наименований), затем идут Philips и HP (более 400 наименований). Исключение составляет выборка по производителю Apple: она сделана чтобы сравнить ее с выборкой по смартфонам.
Мат. ожидание: 7110 руб.
Мат. ожидание: 45112 руб. (по смартфонам было получено 16268 руб.)
Мат. ожидание: 4578 руб.
Мат. ожидание: 18700 руб.
4. Анализ по отзывам.
Так же захотелось посмотреть в какой ценовой категории наблюдается наибольшее количество отзывов о товарах. Алгорим подсчета следующий: делается выборка наименований товаров с сортировкой по цене, по каждому наименованию из этого списка состаляется ценовой диапазон (плюс/мину 5% от стоимости выбранного товара), выбираются наименования товаров, попадающих в этот диапазон, и считается количество отзывов в этой выборке.
Затем я сделал 2 отдельные выборки: с хорошими отзывами и плохими. Алгоритм имеет одно небольшое отличие: из диапазона считаются не все отзывы, а только с плохим рейтингом (1 бал из 5) и хорошим рейтингом (5 из 5). Таким образом получилось две выборки.
Мат. ожидание: 5854 руб.
Мат. ожидание: 2611 руб.
Мат. ожидание: 6605 руб.
Четко видно, что отзывы с плохой оценкой присвоены товарам с более низкой стоимостью (2611 рублей) чем отзывы с хорошей оценкой (6605 рублей). Это можно объяснить как психологией потребителя (к дешевым товарам изначально меньше доверия), так и реальным фактом зависимости цены/качества.
Послесловие.
В заключение хочу еще раз для наглядности привести средние цены по категориям и по производителям, сведя их в 2 разные таблицы.
Таблица 1. Средняя цена для рассмотренных категорий.
Категория | Смартфоны | Стиральные машины | Холодильники |
Средняя цена, руб. | 16268 | 28521 | 28988 |
Таблица 2. Средняя цена для рассмотренных производителей.
Производитель | Bosch | Philips | Aplle | HP |
Средняя цена, руб. | 7110 | 4578 | 45112 | 18700 |
Комментарии
Может я чего не понял но это информация типа средней температуры по больнице?
В какой-то степени можно и так сказать.
А чё это у вас там за товар такой за 1.375.000?
Проектор )))
Было бы лучше, если бы еще привели сравнение удельных характеристик, по "дорогим" и "дешевым" товарам, а не только отзывы в зависимости от цен. Чтобы можно было проанализировать, насколько отзывы верны, или предвзяты.
Что Вы имеете ввиду под удельными характеристиками?
ну, например:
1. Айфон - аккумулятор держит хх часов, функции: а) б) в) г) - стоимость - 100500р
2. Хренфон - аккумулятор держит хх часов (сравнение заявленных характеристик) - стоимость 10р
а далее сравниваем отзывы..
Удельные - имеются в виду "усредненные", ведь понятно что каждый девайс будет выделяться чем либо, но есть характеристики, которые присутствуют во всех девайсах, например - МОЖНО С НЕГО ПОЗВОНИТЬ.
И заметьте, что КАЧЕСТВО в таком случае было бы просто проверить - соответствуют ли отзывы, и реальные характеристики - заявленным.
Вот это была бы картина. Сразу стало бы понятно, что к чему, и что можно брать товар по нормальной цене и при этом не проиграть в качестве.
К сожлению таких данных пока нет, как появятся - обязательно с ними поработаю.
И чо?
На самом деле крайне интересно. Ритейлеры такого рода - не идиоты. И выходит, что они ожидают, что средние холодильник и стиралка будут за 30к. Скажу сразу - у меня дешевле. Конечно, тут бы стату продаж, но кто ж ее даст)
Годно, интересно, спасибо.
В перспективе хочу наличие в магазине/на складе парсить. Тогда можно будет про статус продаж уже что-то сказать.
А если пустить в продажу одну стиралку за 1.500.000 (для особо-особо шизанутых), то мат. ожидание будет 300.000, что ли? Поясните.
Нет, оно сместится конечно, но не на столько. В общем списке наименований товаров есть, например, проектор за почти полтора миллиона.
По моим скромным наблюдениям, наибольшим спросом пользуются стиралки и холодильники в диапазоне 17-20т.р.
Мне кажется это от региона зависит и от года покупки. У меня и двух моих знакомых идентичные посудомоечные машины, но из-за разного года покупки разница в цене превысила 5000.
Ну так холодильники берут не каждый день. По себе знаю, взял два четыре года назад.
А выводы какие? Зачем это все и в чем ценность этого материала?
спасибо! было интересно
выводы сделал сам )
О, чувак, теперь я наконец понял кто придумывает весь этот офисный поток бумаги.
ну, это линейка. без понимания объема продаж по каждому артикулу инфа сомнительной полезности. православно на объем взвешивать.
И по времени - по времени растянуть...
Без измерения времени - ценность инфы отрицательная...
а что по времени? Срезка ассортимента, типичные мастерданные, валидны на определенный момент времени.
И какую ценность они представляют? У этого же ритейлера этот же прайс завтра будет другой и объемы другие. Контекст ситуации поменяется - и сразу другая картинка.
Без времени - ни о чем... Имхо поэтому и сразу же столько вопросов - о чем же статья...
28 тыр за стиралку что-то много. Яндекс маркет за 22 тыра предлагает вполне вменяемую машину