У меня есть набор данных, который содержит вертикальную силу реакции земли для двух вертикальных прыжков, выполненных одним спортсменом. Это непрерывная переменная. У меня также есть столбец, в котором указано смещение спортсмена, которое также является непрерывной переменной. Данные отбираются с частотой 500 Гц для обоих прыжков, но для выполнения прыжка № 1 потребовалось больше времени, чем для прыжка № 2, поэтому он имеет большее количество строк.
Я хочу нормализовать смещение от каждого прыжка по шкале от 0 до 100% от общего смещения, чтобы получить переменную силы равной длины для обоих прыжков. Затем я хочу рассчитать среднее значение кривой зависимости силы от смещения по прыжкам.
Поскольку набор данных довольно длинный, я включил сокращенный пример того, как данные существуют в настоящее время и как я хочу, чтобы они выглядели в конечном итоге. Я надеюсь, что кто-то сможет предложить хороший подход для нормализации смещения по шкале от 0 до 100% и обеспечения одинакового количества строк для каждого прыжка.
NB: в приведенном ниже коде я решил представить частоту дискретизации 10 Гц, просто чтобы проиллюстрировать, как данные настраиваются простым способом, чтобы я мог получить несколько советов по своему подходу.
Текущая структура необработанных данных:
Jump_Number Displacement Force Time
1 0 800 0
1 -0.10 700 0.1
1 -0.29 500 0.2
1 -0.40 200 0.3
1 -0.45 100 0.4
1 -0.50 500 0.5
1 -0.30 800 0.6
1 -0.10 1200 0.7
1 -0.05 1300 0.8
1 0.05 1250 0.9
2 0 800 0.0
2 -0.10 678 0.1
2 -0.29 499 0.2
2 -0.40 178 0.3
2 -0.45 90 0.4
2 -0.50 600 0.5
2 -0.40 810 0.6
2 -0.35 999 0.7
2 -0.29 1135 0.8
2 -0.10 1250 0.9
2 -0.05 1401 1.0
2 0.05 1345 1.1
Желаемая нормализованная структура данных:
Jump_Number Normalized_Displacement_(%) Force
1 0 800
1 10 700
1 20 500
1 30 200
1 40 100
1 50 500
1 60 800
1 70 1200
1 80 1300
1 90 1289
1 100 1250
2 0 800
2 10 678
2 20 499
2 30 178
2 40 90
2 50 600
2 60 810
2 70 999
2 80 1135
2 90 1250
2 100 1345
(Displacement - min) / range * 100
. - person Bulat   schedule 20.05.2016