rusty1s
diff --git a/‎csrc/cpu/knn_cpu.cpp‎
Lines changed: 52 additions & 128 deletions b/‎csrc/cpu/knn_cpu.cpp‎
Lines changed: 52 additions & 128 deletions
diff --git a/‎csrc/cpu/knn_cpu.h‎
Lines changed: 4 additions & 10 deletions b/‎csrc/cpu/knn_cpu.h‎
Lines changed: 4 additions & 10 deletions
diff --git a/‎csrc/cpu/radius_cpu.cpp‎
Lines changed: 52 additions & 127 deletions b/‎csrc/cpu/radius_cpu.cpp‎
Lines changed: 52 additions & 127 deletions
@@ -1,130 +1,54 @@
-#include "radius_cpu.h"
-#include <algorithm>
-#include "utils.h"
-#include <cstdint>
-
-
-torch::Tensor knn_cpu(torch::Tensor support, torch::Tensor query, 
-			 int64_t k, int64_t n_threads){
-
-	CHECK_CPU(query);
-	CHECK_CPU(support);
-
-	torch::Tensor out;
-	std::vector<size_t>* neighbors_indices = new std::vector<size_t>(); 
-	auto options = torch::TensorOptions().dtype(torch::kLong).device(torch::kCPU);
-	int max_count = 0;
-
-	AT_DISPATCH_ALL_TYPES(query.scalar_type(), "radius_cpu", [&] {
-
-	auto data_q = query.data_ptr<scalar_t>();
-	auto data_s = support.data_ptr<scalar_t>();
-	std::vector<scalar_t> queries_stl = std::vector<scalar_t>(data_q,
-								   data_q + query.size(0)*query.size(1));
-	std::vector<scalar_t> supports_stl = std::vector<scalar_t>(data_s,
-								   data_s + support.size(0)*support.size(1));
-
-	int dim = torch::size(query, 1);
-
-	max_count = nanoflann_neighbors<scalar_t>(queries_stl, supports_stl ,neighbors_indices, 0, dim, 0, n_threads, k, 0);
-
-	});
-
-	size_t* neighbors_indices_ptr = neighbors_indices->data();
-
-	const long long tsize = static_cast<long long>(neighbors_indices->size()/2);
-	out = torch::from_blob(neighbors_indices_ptr, {tsize, 2}, options=options);
-	out = out.t();
-
-	auto result = torch::zeros_like(out);
-
-	auto index = torch::tensor({1,0});
-
-	result.index_copy_(0, index, out);
-
-	return result;
-}
+#include "knn_cpu.h"
 
-
-void get_size_batch(const std::vector<long>& batch, std::vector<long>& res){
-
-	res.resize(batch[batch.size()-1]-batch[0]+1, 0);
-	long ind = batch[0];
-	long incr = 1;
-	for(unsigned long i=1; i < batch.size(); i++){
-
-		if(batch[i] == ind)
-			incr++;
-		else{
-			res[ind-batch[0]] = incr;
-			incr =1;
-			ind = batch[i];
-		}
-	}
-	res[ind-batch[0]] = incr;
+#include "utils.h"
+#include "utils/neighbors.cpp"
+
+torch::Tensor knn_cpu(torch::Tensor x, torch::Tensor y,
+                      torch::optional<torch::Tensor> ptr_x,
+                      torch::optional<torch::Tensor> ptr_y, int64_t k,
+                      int64_t num_workers) {
+
+  CHECK_CPU(x);
+  CHECK_INPUT(x.dim() == 2);
+  CHECK_CPU(y);
+  CHECK_INPUT(y.dim() == 2);
+
+  if (ptr_x.has_value()) {
+    CHECK_CPU(ptr_x.value());
+    CHECK_INPUT(ptr_x.value().dim() == 1);
+  }
+  if (ptr_y.has_value()) {
+    CHECK_CPU(ptr_y.value());
+    CHECK_INPUT(ptr_y.value().dim() == 1);
+  }
+
+  std::vector<size_t> *out_vec = new std::vector<size_t>();
+
+  AT_DISPATCH_ALL_TYPES(x.scalar_type(), "radius_cpu", [&] {
+    auto x_data = x.data_ptr<scalar_t>();
+    auto y_data = y.data_ptr<scalar_t>();
+    auto x_vec = std::vector<scalar_t>(x_data, x_data + x.numel());
+    auto y_vec = std::vector<scalar_t>(y_data, y_data + y.numel());
+
+    if (!ptr_x.has_value()) {
+      nanoflann_neighbors<scalar_t>(y_vec, x_vec, out_vec, 0, x.size(-1), 0,
+                                    num_workers, k, 0);
+    } else {
+      auto sx = (ptr_x.value().narrow(0, 1, ptr_x.value().numel() - 1) -
+                 ptr_x.value().narrow(0, 0, ptr_x.value().numel() - 1));
+      auto sy = (ptr_y.value().narrow(0, 1, ptr_y.value().numel() - 1) -
+                 ptr_y.value().narrow(0, 0, ptr_y.value().numel() - 1));
+      auto sx_data = sx.data_ptr<int64_t>();
+      auto sy_data = sy.data_ptr<int64_t>();
+      auto sx_vec = std::vector<long>(sx_data, sx_data + sx.numel());
+      auto sy_vec = std::vector<long>(sy_data, sy_data + sy.numel());
+      batch_nanoflann_neighbors<scalar_t>(y_vec, x_vec, sy_vec, sx_vec, out_vec,
+                                          k, x.size(-1), 0, k, 0);
+    }
+  });
+
+  const int64_t size = out_vec->size() / 2;
+  auto out = torch::from_blob(out_vec->data(), {size, 2},
+                              x.options().dtype(torch::kLong));
+  return out.t().index_select(0, torch::tensor({1, 0}));
 }
-
-torch::Tensor batch_knn_cpu(torch::Tensor support,
-			       torch::Tensor query,
-			       torch::Tensor support_batch,
-			       torch::Tensor query_batch,
-			       int64_t k) {
-
-	CHECK_CPU(query);
-	CHECK_CPU(support);
-	CHECK_CPU(query_batch);
-	CHECK_CPU(support_batch);
-
-	torch::Tensor out;
-	auto data_qb = query_batch.data_ptr<int64_t>();
-	auto data_sb = support_batch.data_ptr<int64_t>();
-	
-	std::vector<long> query_batch_stl = std::vector<long>(data_qb, data_qb+query_batch.size(0));
-	std::vector<long> size_query_batch_stl;
-	CHECK_INPUT(std::is_sorted(query_batch_stl.begin(),query_batch_stl.end()));
-	get_size_batch(query_batch_stl, size_query_batch_stl);
-	
-	std::vector<long> support_batch_stl = std::vector<long>(data_sb, data_sb+support_batch.size(0));
-	std::vector<long> size_support_batch_stl;
-	CHECK_INPUT(std::is_sorted(support_batch_stl.begin(),support_batch_stl.end()));
-	get_size_batch(support_batch_stl, size_support_batch_stl);
-	
-	std::vector<size_t>* neighbors_indices = new std::vector<size_t>(); 
-	auto options = torch::TensorOptions().dtype(torch::kLong).device(torch::kCPU);
-	int max_count = 0;
-
-	AT_DISPATCH_ALL_TYPES(query.scalar_type(), "batch_radius_cpu", [&] {
-	auto data_q = query.data_ptr<scalar_t>();
-	auto data_s = support.data_ptr<scalar_t>();
-	std::vector<scalar_t> queries_stl = std::vector<scalar_t>(data_q,
-								  data_q + query.size(0)*query.size(1));
-	std::vector<scalar_t> supports_stl = std::vector<scalar_t>(data_s,
-								   data_s + support.size(0)*support.size(1));
-
-	int dim = torch::size(query, 1);
-	max_count = batch_nanoflann_neighbors<scalar_t>(queries_stl,
-							    supports_stl,
-							    size_query_batch_stl,
-							    size_support_batch_stl,
-							    neighbors_indices,
-							    0,
-								dim,
-							    0,
-							    k, 0);
-	});
-
-	size_t* neighbors_indices_ptr = neighbors_indices->data();
-
-
-	const long long tsize = static_cast<long long>(neighbors_indices->size()/2);
-	out = torch::from_blob(neighbors_indices_ptr, {tsize, 2}, options=options);
-	out = out.t();
-
-	auto result = torch::zeros_like(out);
-
-	auto index = torch::tensor({1,0});
-
-	result.index_copy_(0, index, out);
-
-	return result;
-}
@@ -1,14 +1,8 @@
 #pragma once
 
 #include <torch/extension.h>
-#include "utils/neighbors.cpp"
-#include <iostream>
 
-torch::Tensor knn_cpu(torch::Tensor support, torch::Tensor query, 
-			 int64_t k, int64_t n_threads);
-
-torch::Tensor batch_knn_cpu(torch::Tensor support,
-			       torch::Tensor query,
-			       torch::Tensor support_batch,
-			       torch::Tensor query_batch,
-			       int64_t k);
+torch::Tensor knn_cpu(torch::Tensor x, torch::Tensor y,
+                      torch::optional<torch::Tensor> ptr_x,
+                      torch::optional<torch::Tensor> ptr_y, int64_t k,
+                      int64_t num_workers);
@@ -1,130 +1,55 @@
 #include "radius_cpu.h"
-#include <algorithm>
-#include "utils.h"
-#include <cstdint>
-
-
-torch::Tensor radius_cpu(torch::Tensor support, torch::Tensor query, 
-			 double radius, int64_t max_num, int64_t n_threads){
-
-	CHECK_CPU(query);
-	CHECK_CPU(support);
-
-	torch::Tensor out;
-	std::vector<size_t>* neighbors_indices = new std::vector<size_t>(); 
-	auto options = torch::TensorOptions().dtype(torch::kLong).device(torch::kCPU);
-	int max_count = 0;
-
-	AT_DISPATCH_ALL_TYPES(query.scalar_type(), "radius_cpu", [&] {
-
-	auto data_q = query.data_ptr<scalar_t>();
-	auto data_s = support.data_ptr<scalar_t>();
-	std::vector<scalar_t> queries_stl = std::vector<scalar_t>(data_q,
-								   data_q + query.size(0)*query.size(1));
-	std::vector<scalar_t> supports_stl = std::vector<scalar_t>(data_s,
-								   data_s + support.size(0)*support.size(1));
-
-	int dim = torch::size(query, 1);
-
-	max_count = nanoflann_neighbors<scalar_t>(queries_stl, supports_stl ,neighbors_indices, radius, dim, max_num, n_threads, 0, 1);
-
-	});
-
-	size_t* neighbors_indices_ptr = neighbors_indices->data();
-
-	const long long tsize = static_cast<long long>(neighbors_indices->size()/2);
-	out = torch::from_blob(neighbors_indices_ptr, {tsize, 2}, options=options);
-	out = out.t();
-
-	auto result = torch::zeros_like(out);
-
-	auto index = torch::tensor({1,0});
-
-	result.index_copy_(0, index, out);
-
-	return result;
-}
 
-
-void get_size_batch(const std::vector<long>& batch, std::vector<long>& res){
-
-	res.resize(batch[batch.size()-1]-batch[0]+1, 0);
-	long ind = batch[0];
-	long incr = 1;
-	for(unsigned long i=1; i < batch.size(); i++){
-
-		if(batch[i] == ind)
-			incr++;
-		else{
-			res[ind-batch[0]] = incr;
-			incr =1;
-			ind = batch[i];
-		}
-	}
-	res[ind-batch[0]] = incr;
+#include "utils.h"
+#include "utils/neighbors.cpp"
+
+torch::Tensor radius_cpu(torch::Tensor x, torch::Tensor y,
+                         torch::optional<torch::Tensor> ptr_x,
+                         torch::optional<torch::Tensor> ptr_y, double r,
+                         int64_t max_num_neighbors, int64_t num_workers) {
+
+  CHECK_CPU(x);
+  CHECK_INPUT(x.dim() == 2);
+  CHECK_CPU(y);
+  CHECK_INPUT(y.dim() == 2);
+
+  if (ptr_x.has_value()) {
+    CHECK_CPU(ptr_x.value());
+    CHECK_INPUT(ptr_x.value().dim() == 1);
+  }
+  if (ptr_y.has_value()) {
+    CHECK_CPU(ptr_y.value());
+    CHECK_INPUT(ptr_y.value().dim() == 1);
+  }
+
+  std::vector<size_t> *out_vec = new std::vector<size_t>();
+
+  AT_DISPATCH_ALL_TYPES(x.scalar_type(), "radius_cpu", [&] {
+    auto x_data = x.data_ptr<scalar_t>();
+    auto y_data = y.data_ptr<scalar_t>();
+    auto x_vec = std::vector<scalar_t>(x_data, x_data + x.numel());
+    auto y_vec = std::vector<scalar_t>(y_data, y_data + y.numel());
+
+    if (!ptr_x.has_value()) {
+      nanoflann_neighbors<scalar_t>(y_vec, x_vec, out_vec, r, x.size(-1),
+                                    max_num_neighbors, num_workers, 0, 1);
+    } else {
+      auto sx = (ptr_x.value().narrow(0, 1, ptr_x.value().numel() - 1) -
+                 ptr_x.value().narrow(0, 0, ptr_x.value().numel() - 1));
+      auto sy = (ptr_y.value().narrow(0, 1, ptr_y.value().numel() - 1) -
+                 ptr_y.value().narrow(0, 0, ptr_y.value().numel() - 1));
+      auto sx_data = sx.data_ptr<int64_t>();
+      auto sy_data = sy.data_ptr<int64_t>();
+      auto sx_vec = std::vector<long>(sx_data, sx_data + sx.numel());
+      auto sy_vec = std::vector<long>(sy_data, sy_data + sy.numel());
+      batch_nanoflann_neighbors<scalar_t>(y_vec, x_vec, sy_vec, sx_vec, out_vec,
+                                          r, x.size(-1), max_num_neighbors, 0,
+                                          1);
+    }
+  });
+
+  const int64_t size = out_vec->size() / 2;
+  auto out = torch::from_blob(out_vec->data(), {size, 2},
+                              x.options().dtype(torch::kLong));
+  return out.t().index_select(0, torch::tensor({1, 0}));
 }
-
-torch::Tensor batch_radius_cpu(torch::Tensor support,
-			       torch::Tensor query,
-			       torch::Tensor support_batch,
-			       torch::Tensor query_batch,
-			       double radius, int64_t max_num) {
-
-	CHECK_CPU(query);
-	CHECK_CPU(support);
-	CHECK_CPU(query_batch);
-	CHECK_CPU(support_batch);
-
-	torch::Tensor out;
-	auto data_qb = query_batch.data_ptr<int64_t>();
-	auto data_sb = support_batch.data_ptr<int64_t>();
-	
-	std::vector<long> query_batch_stl = std::vector<long>(data_qb, data_qb+query_batch.size(0));
-	std::vector<long> size_query_batch_stl;
-	CHECK_INPUT(std::is_sorted(query_batch_stl.begin(),query_batch_stl.end()));
-	get_size_batch(query_batch_stl, size_query_batch_stl);
-	
-	std::vector<long> support_batch_stl = std::vector<long>(data_sb, data_sb+support_batch.size(0));
-	std::vector<long> size_support_batch_stl;
-	CHECK_INPUT(std::is_sorted(support_batch_stl.begin(),support_batch_stl.end()));
-	get_size_batch(support_batch_stl, size_support_batch_stl);
-	
-	std::vector<size_t>* neighbors_indices = new std::vector<size_t>(); 
-	auto options = torch::TensorOptions().dtype(torch::kLong).device(torch::kCPU);
-	int max_count = 0;
-
-	AT_DISPATCH_ALL_TYPES(query.scalar_type(), "batch_radius_cpu", [&] {
-	auto data_q = query.data_ptr<scalar_t>();
-	auto data_s = support.data_ptr<scalar_t>();
-	std::vector<scalar_t> queries_stl = std::vector<scalar_t>(data_q,
-								  data_q + query.size(0)*query.size(1));
-	std::vector<scalar_t> supports_stl = std::vector<scalar_t>(data_s,
-								   data_s + support.size(0)*support.size(1));
-
-	int dim = torch::size(query, 1);
-	max_count = batch_nanoflann_neighbors<scalar_t>(queries_stl,
-							    supports_stl,
-							    size_query_batch_stl,
-							    size_support_batch_stl,
-							    neighbors_indices,
-							    radius,
-								dim,
-							    max_num,
-								0, 1);
-	});
-
-	size_t* neighbors_indices_ptr = neighbors_indices->data();
-
-
-	const long long tsize = static_cast<long long>(neighbors_indices->size()/2);
-	out = torch::from_blob(neighbors_indices_ptr, {tsize, 2}, options=options);
-	out = out.t();
-
-	auto result = torch::zeros_like(out);
-
-	auto index = torch::tensor({1,0});
-
-	result.index_copy_(0, index, out);
-
-	return result;
-}