rusty1s
diff --git a/‎csrc/cpu/knn_cpu.cpp‎
Lines changed: 130 additions & 0 deletions b/‎csrc/cpu/knn_cpu.cpp‎
Lines changed: 130 additions & 0 deletions
diff --git a/‎csrc/cpu/knn_cpu.h‎
Lines changed: 15 additions & 0 deletions b/‎csrc/cpu/knn_cpu.h‎
Lines changed: 15 additions & 0 deletions
diff --git a/‎csrc/cpu/radius_cpu.cpp‎
Lines changed: 21 additions & 9 deletions b/‎csrc/cpu/radius_cpu.cpp‎
Lines changed: 21 additions & 9 deletions
diff --git a/‎csrc/cpu/radius_cpu.h‎
Lines changed: 0 additions & 1 deletion b/‎csrc/cpu/radius_cpu.h‎
Lines changed: 0 additions & 1 deletion
diff --git a/‎csrc/cpu/utils/neighbors.cpp‎
Lines changed: 52 additions & 14 deletions b/‎csrc/cpu/utils/neighbors.cpp‎
Lines changed: 52 additions & 14 deletions
@@ -0,0 +1,130 @@
+#include "radius_cpu.h"
+#include <algorithm>
+#include "utils.h"
+#include <cstdint>
+
+
+torch::Tensor knn_cpu(torch::Tensor support, torch::Tensor query, 
+			 int64_t k, int64_t n_threads){
+
+	CHECK_CPU(query);
+	CHECK_CPU(support);
+
+	torch::Tensor out;
+	std::vector<size_t>* neighbors_indices = new std::vector<size_t>(); 
+	auto options = torch::TensorOptions().dtype(torch::kLong).device(torch::kCPU);
+	int max_count = 0;
+
+	AT_DISPATCH_ALL_TYPES(query.scalar_type(), "radius_cpu", [&] {
+
+	auto data_q = query.data_ptr<scalar_t>();
+	auto data_s = support.data_ptr<scalar_t>();
+	std::vector<scalar_t> queries_stl = std::vector<scalar_t>(data_q,
+								   data_q + query.size(0)*query.size(1));
+	std::vector<scalar_t> supports_stl = std::vector<scalar_t>(data_s,
+								   data_s + support.size(0)*support.size(1));
+
+	int dim = torch::size(query, 1);
+
+	max_count = nanoflann_neighbors<scalar_t>(queries_stl, supports_stl ,neighbors_indices, 0, dim, 0, n_threads, k, 0);
+
+	});
+
+	size_t* neighbors_indices_ptr = neighbors_indices->data();
+
+	const long long tsize = static_cast<long long>(neighbors_indices->size()/2);
+	out = torch::from_blob(neighbors_indices_ptr, {tsize, 2}, options=options);
+	out = out.t();
+
+	auto result = torch::zeros_like(out);
+
+	auto index = torch::tensor({1,0});
+
+	result.index_copy_(0, index, out);
+
+	return result;
+}
+
+
+void get_size_batch(const std::vector<long>& batch, std::vector<long>& res){
+
+	res.resize(batch[batch.size()-1]-batch[0]+1, 0);
+	long ind = batch[0];
+	long incr = 1;
+	for(unsigned long i=1; i < batch.size(); i++){
+
+		if(batch[i] == ind)
+			incr++;
+		else{
+			res[ind-batch[0]] = incr;
+			incr =1;
+			ind = batch[i];
+		}
+	}
+	res[ind-batch[0]] = incr;
+}
+
+torch::Tensor batch_knn_cpu(torch::Tensor support,
+			       torch::Tensor query,
+			       torch::Tensor support_batch,
+			       torch::Tensor query_batch,
+			       int64_t k) {
+
+	CHECK_CPU(query);
+	CHECK_CPU(support);
+	CHECK_CPU(query_batch);
+	CHECK_CPU(support_batch);
+
+	torch::Tensor out;
+	auto data_qb = query_batch.data_ptr<int64_t>();
+	auto data_sb = support_batch.data_ptr<int64_t>();
+	
+	std::vector<long> query_batch_stl = std::vector<long>(data_qb, data_qb+query_batch.size(0));
+	std::vector<long> size_query_batch_stl;
+	CHECK_INPUT(std::is_sorted(query_batch_stl.begin(),query_batch_stl.end()));
+	get_size_batch(query_batch_stl, size_query_batch_stl);
+	
+	std::vector<long> support_batch_stl = std::vector<long>(data_sb, data_sb+support_batch.size(0));
+	std::vector<long> size_support_batch_stl;
+	CHECK_INPUT(std::is_sorted(support_batch_stl.begin(),support_batch_stl.end()));
+	get_size_batch(support_batch_stl, size_support_batch_stl);
+	
+	std::vector<size_t>* neighbors_indices = new std::vector<size_t>(); 
+	auto options = torch::TensorOptions().dtype(torch::kLong).device(torch::kCPU);
+	int max_count = 0;
+
+	AT_DISPATCH_ALL_TYPES(query.scalar_type(), "batch_radius_cpu", [&] {
+	auto data_q = query.data_ptr<scalar_t>();
+	auto data_s = support.data_ptr<scalar_t>();
+	std::vector<scalar_t> queries_stl = std::vector<scalar_t>(data_q,
+								  data_q + query.size(0)*query.size(1));
+	std::vector<scalar_t> supports_stl = std::vector<scalar_t>(data_s,
+								   data_s + support.size(0)*support.size(1));
+
+	int dim = torch::size(query, 1);
+	max_count = batch_nanoflann_neighbors<scalar_t>(queries_stl,
+							    supports_stl,
+							    size_query_batch_stl,
+							    size_support_batch_stl,
+							    neighbors_indices,
+							    0,
+								dim,
+							    0,
+							    k, 0);
+	});
+
+	size_t* neighbors_indices_ptr = neighbors_indices->data();
+
+
+	const long long tsize = static_cast<long long>(neighbors_indices->size()/2);
+	out = torch::from_blob(neighbors_indices_ptr, {tsize, 2}, options=options);
+	out = out.t();
+
+	auto result = torch::zeros_like(out);
+
+	auto index = torch::tensor({1,0});
+
+	result.index_copy_(0, index, out);
+
+	return result;
+}
@@ -0,0 +1,15 @@
+#pragma once
+
+#include <torch/extension.h>
+#include "utils/neighbors.cpp"
+#include <iostream>
+#include "compat.h"
+
+torch::Tensor knn_cpu(torch::Tensor support, torch::Tensor query, 
+			 int64_t k, int64_t n_threads);
+
+torch::Tensor batch_knn_cpu(torch::Tensor support,
+			       torch::Tensor query,
+			       torch::Tensor support_batch,
+			       torch::Tensor query_batch,
+			       int64_t k);
@@ -4,7 +4,7 @@
 #include <cstdint>
 
 
-torch::Tensor radius_cpu(torch::Tensor query, torch::Tensor support, 
+torch::Tensor radius_cpu(torch::Tensor support, torch::Tensor query, 
 			 double radius, int64_t max_num, int64_t n_threads){
 
 	CHECK_CPU(query);
@@ -26,7 +26,7 @@ torch::Tensor radius_cpu(torch::Tensor query, torch::Tensor support,
 
 	int dim = torch::size(query, 1);
 
-	max_count = nanoflann_neighbors<scalar_t>(queries_stl, supports_stl ,neighbors_indices, radius, dim, max_num, n_threads);
+	max_count = nanoflann_neighbors<scalar_t>(queries_stl, supports_stl ,neighbors_indices, radius, dim, max_num, n_threads, 0, 1);
 
 	});
 
@@ -36,7 +36,13 @@ torch::Tensor radius_cpu(torch::Tensor query, torch::Tensor support,
 	out = torch::from_blob(neighbors_indices_ptr, {tsize, 2}, options=options);
 	out = out.t();
 
-	return out.clone();
+	auto result = torch::zeros_like(out);
+
+	auto index = torch::tensor({1,0});
+
+	result.index_copy_(0, index, out);
+
+	return result;
 }
 
 
@@ -58,10 +64,10 @@ void get_size_batch(const std::vector<long>& batch, std::vector<long>& res){
 	res[ind-batch[0]] = incr;
 }
 
-torch::Tensor batch_radius_cpu(torch::Tensor query,
-			       torch::Tensor support,
-			       torch::Tensor query_batch,
+torch::Tensor batch_radius_cpu(torch::Tensor support,
+			       torch::Tensor query,
 			       torch::Tensor support_batch,
+			       torch::Tensor query_batch,
 			       double radius, int64_t max_num) {
 
 	CHECK_CPU(query);
@@ -103,8 +109,8 @@ torch::Tensor batch_radius_cpu(torch::Tensor query,
 							    neighbors_indices,
 							    radius,
 								dim,
-							    max_num
-							    );
+							    max_num,
+								0, 1);
 	});
 
 	size_t* neighbors_indices_ptr = neighbors_indices->data();
@@ -114,5 +120,11 @@ torch::Tensor batch_radius_cpu(torch::Tensor query,
 	out = torch::from_blob(neighbors_indices_ptr, {tsize, 2}, options=options);
 	out = out.t();
 
-	return out.clone();
+	auto result = torch::zeros_like(out);
+
+	auto index = torch::tensor({1,0});
+
+	result.index_copy_(0, index, out);
+
+	return result;
 }
@@ -1,7 +1,6 @@
 #pragma once
 
 #include <torch/extension.h>
-//#include "utils/neighbors.h"
 #include "utils/neighbors.cpp"
 #include <iostream>
 #include "compat.h"
 
@@ -3,6 +3,7 @@
 #include <set>
 #include <cstdint>
 #include <thread>
+#include <iostream>
 
 typedef struct thread_struct {
 	void* kd_tree;
@@ -15,6 +16,8 @@ typedef struct thread_struct {
 	size_t end;
 	double search_radius;
 	bool small;
+	bool option;
+	size_t k;
 } thread_args;
 
 template<typename scalar_t>
@@ -37,7 +40,7 @@ void thread_routine(thread_args* targs) {
 	double search_radius = (double) targs->search_radius;
 	size_t start = targs->start;
 	size_t end = targs->end;
-	
+	auto k = targs->k;
 	for (size_t i = start; i < end; i++) {
 
 		std::vector<scalar_t> p0 = *(((*pcd_query).pts)[i]);
@@ -46,11 +49,23 @@ void thread_routine(thread_args* targs) {
 		std::copy(p0.begin(), p0.end(), query_pt);
 		(*matches)[i].reserve(*max_count);
 		std::vector<std::pair<size_t, scalar_t> > ret_matches;
+		std::vector<size_t>* knn_ret_matches = new std::vector<size_t>(k);
+		std::vector<scalar_t>* knn_dist_matches = new std::vector<scalar_t>(k);
 
 		tree_m->lock();
 
-		const size_t nMatches = index->radiusSearch(query_pt, (scalar_t)(search_radius+eps), ret_matches, nanoflann::SearchParams());
-		
+		size_t nMatches;
+		if (targs->option){
+			nMatches = index->radiusSearch(query_pt, (scalar_t)(search_radius+eps), ret_matches, nanoflann::SearchParams());
+		}
+		else {
+			nMatches = index->knnSearch(query_pt, k, &(*knn_ret_matches)[0],&(* knn_dist_matches)[0]);
+			auto temp = new std::vector<std::pair<size_t, scalar_t> >((*knn_dist_matches).size());
+			for (size_t j = 0; j < (*knn_ret_matches).size(); j++){
+				(*temp)[j] = std::make_pair( (*knn_ret_matches)[j],(*knn_dist_matches)[j] );
+			}
+			ret_matches = *temp;
+		}
 		tree_m->unlock();
 
 		(*matches)[i] = ret_matches;
@@ -67,7 +82,8 @@ void thread_routine(thread_args* targs) {
 
 template<typename scalar_t>
 size_t nanoflann_neighbors(std::vector<scalar_t>& queries, std::vector<scalar_t>& supports,
-			std::vector<size_t>*& neighbors_indices, double radius, int dim, int64_t max_num, int64_t n_threads){
+			std::vector<size_t>*& neighbors_indices, double radius, int dim, 
+			int64_t max_num, int64_t n_threads, int64_t k, int option){
 
 	const scalar_t search_radius = static_cast<scalar_t>(radius*radius);
 
@@ -120,9 +136,21 @@ size_t nanoflann_neighbors(std::vector<scalar_t>& queries, std::vector<scalar_t>
 
 			(*list_matches)[i0].reserve(*max_count);
 			std::vector<std::pair<size_t, scalar_t> > ret_matches;
+			std::vector<size_t>* knn_ret_matches = new std::vector<size_t>(k);
+			std::vector<scalar_t>* knn_dist_matches = new std::vector<scalar_t>(k);
 
-			const size_t nMatches = index->radiusSearch(query_pt, (scalar_t)(search_radius+eps), ret_matches, search_params);
-			
+			size_t nMatches;
+			if (!!(option)){
+				nMatches = index->radiusSearch(query_pt, (scalar_t)(search_radius+eps), ret_matches, search_params);
+			}
+			else {
+				nMatches = index->knnSearch(query_pt, (size_t)k, &(*knn_ret_matches)[0],&(* knn_dist_matches)[0]);
+				auto temp = new std::vector<std::pair<size_t, scalar_t> >((*knn_dist_matches).size());
+				for (size_t j = 0; j < (*knn_ret_matches).size(); j++){
+					(*temp)[j] = std::make_pair( (*knn_ret_matches)[j],(*knn_dist_matches)[j] );
+				}
+				ret_matches = *temp;
+			}
 			(*list_matches)[i0] = ret_matches;
 			if(*max_count < nMatches) *max_count = nMatches;
 			i0++;
@@ -171,6 +199,8 @@ size_t nanoflann_neighbors(std::vector<scalar_t>& queries, std::vector<scalar_t>
 			else {
 				targs->small = false;
 			}
+			targs->option = !!(option);
+			targs->k = k;
 			std::thread* temp = new std::thread(thread_routine<scalar_t>, targs);
 			tid[t] = temp;
 		}
@@ -220,7 +250,7 @@ size_t batch_nanoflann_neighbors (std::vector<scalar_t>& queries,
                                std::vector<long>& q_batches,
                                std::vector<long>& s_batches,
                                std::vector<size_t>*& neighbors_indices,
-                               double radius, int dim, int64_t max_num){
+                               double radius, int dim, int64_t max_num, int64_t k, int option){
 
 
 	// indices
@@ -292,14 +322,22 @@ size_t batch_nanoflann_neighbors (std::vector<scalar_t>& queries,
 		// Initial guess of neighbors size
 		all_inds_dists[i0].reserve(max_count);
 		// Find neighbors
-		size_t nMatches = index->radiusSearch(query_pt, r2+eps, all_inds_dists[i0], search_params);
-		// Update max count
-
-		std::vector<std::pair<size_t, float> > indices_dists;
-		nanoflann::RadiusResultSet<float,size_t> resultSet(r2, indices_dists);
-
-		index->findNeighbors(resultSet, query_pt, search_params);
 
+		size_t nMatches;
+		if (!!option) {
+			nMatches = index->radiusSearch(query_pt, r2+eps, all_inds_dists[i0], search_params);
+			// Update max count
+		}
+		else {
+			std::vector<size_t>* knn_ret_matches = new std::vector<size_t>(k);
+			std::vector<scalar_t>* knn_dist_matches = new std::vector<scalar_t>(k);
+			nMatches = index->knnSearch(query_pt, (size_t)k, &(*knn_ret_matches)[0],&(*knn_dist_matches)[0]);
+			auto temp = new std::vector<std::pair<size_t, scalar_t> >((*knn_dist_matches).size());
+			for (size_t j = 0; j < (*knn_ret_matches).size(); j++){
+				(*temp)[j] = std::make_pair( (*knn_ret_matches)[j],(*knn_dist_matches)[j] );
+			}
+			all_inds_dists[i0] = *temp;
+		}
 		if (nMatches > max_count)
 			max_count = nMatches;
 		// Increment query idx