R语言 具有sf的行间点的距离

c3frrgcw  于 2023-04-27  发布在  其他
关注(0)|答案(2)|浏览(156)

我在简单要素中保存了多个轨迹类型为POINT的(sf)。我想计算后续位置之间的欧氏距离(即行)。直到现在,我已经使用毕达哥拉斯公式“手动”计算了2D空间中的欧氏距离。我想知道我是否可以使用函数sf::st_distance()来做同样的事情。下面是一个简单的例子:

library(sf)
library(dplyr)

set.seed(1)

df <- data.frame(
  gr = c(rep("a",5),rep("b",5)),
  x  = rnorm(10),
  y = rnorm(10)
 )

df <- st_as_sf(df,coords = c("x","y"),remove = F)

df %>%
  group_by(gr) %>%
  mutate(
    dist = sqrt((lead(x)-x)^2+(lead(y)-y)^2)
  )
#> Simple feature collection with 10 features and 4 fields
#> geometry type:  POINT
#> dimension:      XY
#> bbox:           xmin: -0.8356286 ymin: -2.2147 xmax: 1.595281 ymax: 1.511781
#> epsg (SRID):    NA
#> proj4string:    NA
#> # A tibble: 10 x 5
#> # Groups:   gr [2]
#>    gr         x       y   dist                 geometry
#>    <fct>  <dbl>   <dbl>  <dbl>                  <POINT>
#>  1 a     -0.626  1.51    1.38     (-0.6264538 1.511781)
#>  2 a      0.184  0.390   1.44     (0.1836433 0.3898432)
#>  3 a     -0.836 -0.621   2.91   (-0.8356286 -0.6212406)
#>  4 a      1.60  -2.21    3.57        (1.595281 -2.2147)
#>  5 a      0.330  1.12   NA         (0.3295078 1.124931)
#>  6 b     -0.820 -0.0449  1.31  (-0.8204684 -0.04493361)
#>  7 b      0.487 -0.0162  0.992  (0.4874291 -0.01619026)
#>  8 b      0.738  0.944   0.204    (0.7383247 0.9438362)
#>  9 b      0.576  0.821   0.910    (0.5757814 0.8212212)
#> 10 b     -0.305  0.594  NA       (-0.3053884 0.5939013)

我想用sf::st_distance()来计算dist。我该怎么做?

uqxowvwt

uqxowvwt1#

关于sf,首先要知道的是几何列(类sfc的一个)被存储为dataframe中的列表列。通常使用列表列的关键是使用purrr::map和朋友,或者使用一个接受列表列作为参数的函数。在st_distance的情况下,它的参数可以是sf(一个 Dataframe ),sfc(几何列),甚至是sfg(一个几何行)的对象,所以不需要map和朋友。解决方案应该看起来像这样:

df %>%
  group_by(gr) %>%
  mutate(
    dist = st_distance(geometry)
  )

然而,这并不起作用。经过一些调查,我们发现了两个问题。首先,st_distance返回一个距离矩阵,而不是一个单一的值。为了解决这个问题,我们使用st_distanceby_element = T参数。
接下来,我们不能只做dist = st_distance(geometry, lead(geometry), by_element = T),因为lead只对向量列有效,而不是列表列。
为了解决第二个问题,我们自己使用geometry[row_number() + 1]创建了引导列。
以下是完整的解决方案:

library(sf)
library(dplyr)

df %>%
  group_by(gr) %>%
  mutate(
    lead = geometry[row_number() + 1],
    dist = st_distance(geometry, lead, by_element = T),
  )
#> Simple feature collection with 10 features and 4 fields
#> Active geometry column: geometry
#> geometry type:  POINT
#> dimension:      XY
#> bbox:           xmin: -0.8356286 ymin: -2.2147 xmax: 1.595281 ymax: 1.511781
#> epsg (SRID):    4326
#> proj4string:    +proj=longlat +datum=WGS84 +no_defs
#> # A tibble: 10 x 6
#> # Groups:   gr [2]
#>    gr         x       y  dist                       geometry
#>    <fct>  <dbl>   <dbl> <dbl>         <sf_geometry [degree]>
#>  1 a     -0.626  1.51   1.38     POINT (-0.6264538 1.511781)
#>  2 a      0.184  0.390  1.44     POINT (0.1836433 0.3898432)
#>  3 a     -0.836 -0.621  2.91   POINT (-0.8356286 -0.6212406)
#>  4 a      1.60  -2.21   3.57        POINT (1.595281 -2.2147)
#>  5 a      0.330  1.12   0         POINT (0.3295078 1.124931)
#>  6 b     -0.820 -0.0449 1.31  POINT (-0.8204684 -0.04493361)
#>  7 b      0.487 -0.0162 0.992  POINT (0.4874291 -0.01619026)
#>  8 b      0.738  0.944  0.204    POINT (0.7383247 0.9438362)
#>  9 b      0.576  0.821  0.910    POINT (0.5757814 0.8212212)
#> 10 b     -0.305  0.594  0       POINT (-0.3053884 0.5939013)
#> # ... with 1 more variable: lead <sf_geometry [degree]>
r6hnlfcb

r6hnlfcb2#

下面是一个基本的R解决方案。

  1. split()组列的 Dataframe
  • 在每个组上
  • 使用head()tail()计算后续位置之间的距离
  • NA附加到结果中(因为最后一个位置没有后续位置)
  • 使用do.call()中的rbind将生成的sf对象重新绑定在一起。
split(df, df$gr) |> 
  lapply(\(x){
    x$dist <- c(st_distance(head(x,-1), tail(x,-1),by_element = TRUE), NA)
    x
  }) |> 
  do.call(rbind, args = _)

相关问题